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Предлагаемая книга — плод более чем тридцатилетнего 
опыта преподавательской работы автора на кафедре прикладной 
математики и информатики Ижевского государственного техни- 
ческого университета (бывшего механического института). В нее 
включен материал двух предыдущих книг автора «Численные 
методы (линейная алгебра и нелинейные уравнения)» и «Числен- 
ные методы (математический анализ и обыкновенные дифферен- 
циальные уравнения)», выпущенных издательством «Высшая 
школа» соответственно в 2000 и 2001 гг., который дополнен 
кратким изложением методов решения уравнений с частными 
производными. Если вторая из названных книг помещена сюда 
практически без изменений, то первая значительно переработана. 
Кроме исправления замеченных опечаток и пополнения множе- 
ства примеров и упражнений, облегчающих понимание изучае- 
мых методов, новым в этой части является следующее. 

® Первая глава дополнена параграфом 1.7, где можно полу- 
чить первые представления о корректных и некорректных поста- 
новках задач и методах регуляризации (далее, в гл. 13, на этой 
основе показывается регуляризуемость задачи численного диф- 
ференцирования). 

е В гл. 5 ($ 5.7) излагаются совершенно новые модифика- 
ции методов Ньютона и секущих решения нелинейных скаляр- 
ных уравнений, так называемые полюсные методы, имеющие 
зачастую более высокую скорость сходимости, чем их классиче- 
ские прообразы. Изложение этих методов опирается на совмест- 
ные с автором исследования М.Ю. Петрова и Н.А. Рычиной. 

® В $ 7.5 главы 7 (соответствующей гл. 6 первой книги) 
рассматривается обобщение полюсного метода Ньютона на слу- 
чай систем нелинейных конечномерных уравнений, предложен- 
ное автором и М.Ю. Петровым. Кроме того, в этой главе ($ 7.4) 
описан метод секущих Бройдена, являющийся одним из наибо- 
лее эффективных (по требуемому числу вычислений функций) 


методов решения нелинейных систем и, в то же время, практиче- 
ски неупоминаемый в отечественной литературе. 

Цель, которую ставил перед собой автор при написании 
данной книги — это по возможности полно охватить традицион- 
ный учебный курс вычислительной математики, причем так, 
чтобы книга представляла интерес для как можно более широкой 
читательской аудитории с разными уровнями математической 
подготовки, со своими представлениями о необходимой строго- 
сти и достаточной полноте изложения отдельных фактов, с раз- 
ным количеством часов, отводимых учебными планами под 
изучение основ численных методов и, вообще, с разной потреб- 
ностью в предмете изучения. Думается, что достижению этой 
цели должны способствовать следующие обстоятельства. 

® Автор старался донести до читателя прежде всего идею 
каждого метода решения той или иной задачи. При этом некото- 
рые методы полностью обосновывались и доводились до более- 
менее подробного алгоритма, какие-то методы после рассмотре- 
ния идеи сразу снабжались алгоритмами, а знакомство с какими- 
то из методов оставалось на идейном уровне. Если метод не рас- 
сматривался подробно, то обязательно делались ссылки на лите- 
ратурные источники (как правило, это учебные пособия или 
монографии), где можно найти упоминающийся материал. Наи- 
более полно здесь освещены численные методы решения конеч- 
номерных уравнений и задач математического анализа и менее 
полно (в смысле обоснования) методы решения дифференциаль- 
ных уравнений, особенно с частными производными. 

® Считая, что изучение основ численных методов почти 
немыслимо без вычислений, в одном из приложений автор при- 
водит возможные постановки заданий для лабораторных работ 
по курсу, что вместе с сопровождающими изложение методов 
примерами, а также с помещенными в конце каждой главы уп- 
ражнениями должно способствовать осмысленному усвоению 
изучаемого материала. В списке литературы можно найти сведе- 
ния о задачниках по численным методам (см. [15, 65, 87, 89, 142, 
162, 163]), которые полезно иметь в виду при организации прак- 
тических и лабораторных занятий. 


® Хотя автор старался не погружаться в функциональный 
анализ, в определенных местах обойтись совсем без его некото- 
рых первичных понятий не смог (или не захотел, ибо взглянув на 
некоторые вещи чуть-чуть сверху, мы видим их гораздо отчетли- 
вее). Чтобы такие места без особого труда воспринимались чита- 
телями, совсем незнакомыми с функциональным анализом, в 
приложении очень кратко даны необходимые сведения из этой 
математической дисциплины. 

В какой мере автору удалось достичь поставленной цели, 
судить читателю. Автор понимает, что в своей попытке «объять 
необъятное» он создал труд, который одним покажется излишне 
подробным, но недостаточно аргументированным, другим — 
наоборот, перегруженным выводами формул. Хотелось бы наде- 
яться, что многим из тех, кто будет держать в руках эту книгу, 
по крайней мере, в какой-то момент она окажется нужной и 
полезной. 

Автор выражает глубокую благодарность Ученому Совету и 
ректору ИжГТУ проф. И.В. Абрамову за предоставление време- 
ни для написания книги, коллегам по кафедре ПМИ и ее заве- 
дующему доц. А.А. Айзиковичу за содействие в подготовке 
рукописи, проф. А.Л. Тептину за внимательное ее прочтение и 
ценные замечания, А.В. Чуракову и М.Ю. Петрову за компью- 
терный набор текста, формул и рисунков, а также Ю.В. Гаврину 
за приведение набора к единой форме и макетирование книги. 
Автор искренне признателен чл.-корр. РАН В.В. Васину и проф. 
Г.Г. Исламову за проделанную работу по рецензированию книги. 
Особо благодарен автор сыну П.В. Вержбицкому, оказавшему 
всестороннюю помощь на разных этапах работы над книгой. 

Несмотря на то, что к процессу подготовки книги к изда- 
нию причастно много людей, автор не желает переложить на 
других и доли ответственности за ошибки и опечатки, без кото- 
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ГЛАВА 1 || ОБ УЧЕТЕ ПОГРЕШНОСТЕЙ 
ПРИБЛИЖЕННЫХ ВЫЧИСЛЕНИЙ 


Рассматривается круг вопросов, связанных с учетом по- 
грешностей, появление которых неизбежно при численном ана- 
лизе математических моделей, в частности, при решении ли- 
нейных алгебраических систем и нелинейных скалярных уравне- 
ний. Обращается внимание на заведомо приближенный харак- 
тер компьютерных операций над действительными числами. 
Приводятся примеры задач и методов, чрезмерно чувствитель- 
ных к ошибкам исходных данных и к погрешиостям арифмети- 
ческих действий. Даются первые представления о корректных и 
некорректных (по Адамару и по Тихонову) задачах, регуляризи- 
рующем алгоритме и о методе @ -регуляризации Тихонова. 


1.1. ОБЩАЯ ФОРМУЛА ДЛЯ ОЦЕНКИ 
ГЛАВНОИ ЧАСТИ ПОГРЕШНОСТИ 


При численном решении математических и прикладных за- 
дач почти неизбежно появление на том или ином этапе их реше- 
ния погрешностей следующих трех типов. 

1) Погрешность задачи. Она связана с приближенным 
характером исходной содержательной модели (в частности, с не- 
возможностью учесть все факторы в процессе изучения модели- 
руемого явления), а также ее математического описания, пара- 
метрами которого служат обычно приближенные числа (напри- 
мер, из-за принципиальной невозможности выполнения абсо- 
лютно точных измерений). Для вычислителя погрешность задачи 
следует считать неустранимой (безусловной), хотя постановщик 
задачи иногда может ее изменить. 

2) Погрешность метода. Это погрешность, связанная со 
способом решения поставленной математической задачи и появ- 
ляющаяся в результате подмены исходной математической моде- 
ли другой или конечной последовательностью других, например, 
линейных моделей. При создании численных методов закладыва- 
ется возможность отслеживания таких погрешностей и доведе- 
ния их до сколь угодно малого уровня. Отсюда естественно от- 
ношение к погрешности метода как к устранимой (или услов- 
ной). 

3) Погрешность округлений (погрешность действий). Этот 
тип погрешностей обусловлен необходимостью выполнять ариф- 
метические операции над числами, усеченными до количества 
разрядов, зависящего от применяемой вычислительной техники 
(если, разумеется, не используются специальные программные 


средства, реализующие, например, арифметику рациональных 
чисел). 

Все три описанных типа погрешностей в сумме дают пол- 
ную погрешность результата решения задачи. Поскольку пер- 
вый тип погрешностей не находится в пределах компетенции вы- 
числителя, для него он служит лишь ориентиром точности, с ко- 
торой следует рассчитывать математическую модель. Нет смысла 
решать задачу существенно точнее, чем это диктуется неопреде- 
ленностью исходных данных. Таким образом, погрешность ме- 
тода подчиняют погрешности задачи. Наконец, при выводе оце- 
нок погрешностей численных методов обычно исходят из пред- 
положения, что все операции над числами выполняются точно. 
Это означает, что погрешность округлений не должна сущест- 
венно отражаться на результатах реализации методов, т.е. долж- 
на подчиняться погрешности метода. Влияние погрешностей ок- 
руглений не следует упускать из вида ни на стадии отбора и ал- 
горитмизации численных методов, ни при выборе вычислитель- 
ных и программных средств, ни при выполнении отдельных 
действий и вычислении значений функций. 

Рассмотрим некоторые возможные подходы к учету погреш- 
ностей действий ([3, 20, 25, 44, 61, 71, 73, 99] и др.). 

Пусть А и а — два «близких» числа; условимся считать 
А — точным, а — приближенным. 

Величина Ла:=|А-а| называется абсолютной погрешно- 


Аа 
стью приближенного числа а, а да:= — — его относитель- 
а 


ной погрешностью”). Числа Ад и 6. такие, что А„>Аа и 


А 
ба ть называются оценками или границами абсолют- 
а 
ной и относительной погрешностей соответственно (к Ад и д. 
часто применяют также термин «предельные погрешности»). 
Так как обычно истинные погрешности не известны, то там, где 


* 
) 1. Символ «:=» нами используется в двух близких смыслах: 
а) положить по определению, задать, выбрать; 
6) присвоить, т.е. записать в ячейку памяти компьютера, определяе- 
мую идентификатором в левой части, значение, задаваемое правой частью. 


ы да 
2. Возможно, чаще относительной погрешностью называют ТТ. 


Использование символа «А» в дальнейшем может быть двояким: 
как для обозначения абсолютной погрешности, так и для обозначения 
приращения переменной, что будет ясно из контекста либо специально ого- 
ворено. 


не может возникнуть недоразумений, будем иногда называть Аи 
и б., просто абсолютной и относительной погрешностями. 

Поставим вопрос о грубом оценивании погрешности ре- 
зультата вычисления значения дифференцируемой функции 
и=У (1, х2, й ‚х„) приближенных аргументов х1, хо, й ‚хи, ес- 
ли известны границы их абсолютных погрешностей 
Ах, Ах, й ‚Ах, соответственно. В этом случае точные значе- 
ния аргументов х|, х›, й , х„ лежат соответственно на отрезках 
ыы -Ах, м +А», ], > —Ах,,х2 +Ах, ] ‚п, к» -Ах„,х,+А»х, ], а 
точная абсолютная погрешность результата и= /(х1, х2, й ‚х,) 
есть 


Ди=| УС, хо, й ‚хи )-— ЛО, х2,й Е 
— модуль полного приращения функции. Главной, т.е. линейной 
частью этого приращения является, как известно, полный диф- 
ференциал 4и. Таким образом, имеем: 


п, ди би п 
ди = ах < А, 
1х ИХ, Их 
т.е. за границу абсолютной погрешности результата приближен- 
но может быть принята величина 


п,| би 
А, = к 
= Ох, 
= 1 
Отсюда легко получается формула приближенной оценки отно- 
сительной погрешности значения и: 


бе (1.1) 


ых 


А, п|би| Ах п п, |Оти 


=, у 


"М м И ри > "НН 9% 


Г) 


А. (2) 


Как частные случаи формул (1.1), (1.2) (точных для функ- 
ций, линейных относительно х; или шх;, соответственно) можно 


получить известные правила оценивания погрешностей результа- 
тов арифметических действий. 


м би 
Действительно, пусть и=+х| +х2 + Й >). Тогда |-—=1 
ь 


п п 
и Лу) =УГА, =УА, , те. при сложении и вычитании 


приближенных чисел их предельные абсолютные погрешности 
складываются. 


Пусть теперь и=х|-хо-й -х„, где можно считать все сомно- 
жители положительными. Так как ши = шх| + шхо +й +шх, и 


91 | 
ыы =—, то, согласно (1.2), 


9х; Хх; 
п | п 
б их =>— А, =>д,.. (1.3) 
Ты 1 
х бши 1 
Если же и=—, где х|, хо >0, то ши=Шх| —№шхо, =— 
Х2 Ох; х; 
и, значит, 
А, А 
МИ: 22: _ 
бх /х, = + =д, +6... 
2 


Последнее вместе с (1.3) означает известный результат о сложе- 
нии предельных относительных погрешностей при умножении и 
делении приближенных чисел. 

Возвращаясь к сложению, рассмотрим относительную по- 
грешность суммы и положительных приближенных чисел 
Хх, х2, йЙ ‚хи, имеющих границы относительных погрешностей 


б,,0х,,Й ‚дх, соответственно: 
А(х1 + хо +Й +х,) < 


9+ хо +Й +х,)= 
к. ы ж +%-+Й +х, 


Ах -+х,+й  _ Ах +Ах, +7 +А,, — 


хх +Й +, 42% +й +; 


_ х1бх + х2бх, +Й +х,дб,, Е х6* +х26” +Й +х,б” —5* 
ж+х2 +Й +х, ^ м +х2+Й +х, ’ 


* 
где д = тах дух. . Полученное неравенство говорит о том, что 
1 


относительная погрешность суммы и положительных прибли- 
женных чисел не превосходит максимальной относительной по- 
грешности слагаемых. 
С вычитанием приближенных чисел дело обстоит хуже: 
оценка 
р _ Ах х, _ Ах +Ах, 
Я [м -х2|  ра-х2| 


относительной погрешности разности х|-х› двух приближен- 
ных положительных чисел указывает на возможность сильного 
возрастания погрешности при х| —х› —> 0. В этом случае говорят 
о потере точности при вычитании близких чисел. 

Часто возникает обратная задача теории погрешностей: 
какой точности данные нужно подать на вход, чтобы на выходе 
получить результат заданной точности? Применительно к по- 
ставленной выше прямой задаче оценивания погрешности ре- 
зультата вычисления значения функции при заданных оценках 
погрешностей аргументов обратная задача заключается в оцени- 
вании величин Дх; (или дх;) по известной величине Ли. Для слу- 
чая дифференцируемой функции одной переменной грубое ре- 
шение обратной задачи т если у=Г(х), то 


Ду=|Ч |= | '(х)Ах, откуда Ах=———. Для функции большего 


тот 


числа переменных обратная задача, вообще говоря, некорректна. 
Нужны дополнительные условия. Например, применяют ирин- 
цип равных влияний, состоящий в предположении, что частные 


би 
дифференциалы я в (1.Г) одинаково влияют на погреш- 


7 
ность значения функции; тогда 


7 
В качестве другого довольно естественного допущения можно 
принять равенство относительных погрешностей всех аргумен- 


х; . 
тов, Т.е. считать 6», =—=р при всех 1=1 2, й ‚п. Тогда 


Я 


п. | би 
Ах = ху и, значит, А, =р»|-—х,. Из последнего равенства 


А 
получаем величину р=——“_— (характеризующую относи- 
2] 9х; 


тельный уровень точности задания аргументов), на основе кото- 
рой за границы абсолютных погрешностей аргументов принима- 
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НГ ' 2х, 
решению обратной задачи (см., например, [13]). 


1.2. СТАТИСТИЧЕСКИЙ И ТЕХНИЧЕСКИЙ 
ПОДХОДЫ К УЧЕТУ ПОГРЕШНОСТЕЙ 
ДЕЙСТВИЙ 


Рассмотренный выше аналитический (или классический) 
способ учета погрешностей действий, предполагающий точ- 
ное оценивание погрешностей, основанное либо на приведенных 
в предыдущем параграфе правилах подсчета погрешностей 
арифметических действий, либо на параллельной работе с верх- 
ними и нижними границами исходных данных, имеет два суще- 
ственных недостатка. Во-первых, этот способ чрезвычайно гро- 
моздок и не может быть рекомендован при массовых вычислени- 
ях. Во-вторых, он учитывает крайние, наихудшие случаи взаимо- 
действия погрешностей, которые допустимы, но маловероятны. 
Ясно, что, например, при суммировании нескольких приближен- 
ных чисел (полученных в результате измерений, округлений или 
каким-либо другим путем) среди них почти наверное будут сла- 
гаемые как с избытком, так и с недостатком, т.е. произойдет час- 
тичная компенсация погрешностей. При больших количествах 
однотипных вычислений вступают в силу уже вероятностные 
или статистические законы формирования погрешностей ре- 
зультатов действий. Например, методами теории вероятностей 
показывается, что математическое ожидание абсолютной по- 
грешности суммы и слагаемых с одинаковым уровнем абсолют- 
ных погрешностей, при достаточно большом и, пропорциональ- 


но и ([20, 25, 61]). В частности, если и >10 и все слагаемые ок- 
руглены до т-го десятичного разряда, то для подсчета абсолют- 
ной погрешности суммы 5 применяют правило Чеботарева 


Аб = МЗи- 0.5.10”. (1.4) 


Различие в результатах классического и статистического 
подходов к оцениванию погрешности суммы рассмотрим на 
примере оценки погрешности среднего арифметического не- 
скольких приближенных чисел. 


1 
Пусть х=-—(х1+Й +х,) — среднее арифметическое и 


(п>10) приближенных чисел (например, результатов измере- 
ний), имеющих одинаковый уровень абсолютных погрешностей 
Ах = 0.5.10". Тогда классическая оценка абсолютной погреш- 
ности величины х есть 


А, = ЦА, +1 +4, =. и.0.5-10-" = 0.5-10-" = А, 
п п п 1 


т.е. такая же, как и у исходных данных. В то же время по форму- 
ле (1.4) имеем 


_ 1 -т _ 3 -т _ 3 
А, = -0.5-10 = 3.0.5.10" = /З.л, —_— 50. 


1 и 


Как видим, применение правила Чеботарева приводит к естест- 
венному выводу о том, что арифметическое усреднение резуль- 
татов измерений или наблюдений увеличивает точность, чего 
нельзя сказать на основе классической теории погрешностей. 


Прямое применение вероятностно-статистических оценок 
погрешностей также является достаточно сложным делом и вряд 
ли может быть рекомендовано при рядовых массовых вычисле- 
ниях. Однако именно такие оценки подкрепляют практические 
правила работы с приближенными числами, составляющие осно- 
ву так называемого технического подхода. Этот подход связы- 
вают с именем известного русского кораблестроителя, математи- 
ка и механика академика А. Н. Крылова”). Согласно приниипу 
А. Н. Крылова, приближенное число должно записываться так, 
чтобы в нем все значащие цифры, кроме последней, были верны- 
ми и лишь последняя была бы сомнительна, и притом в сред- 
нем** не более чем на одну единицу. Напомним, что значащими 
цифрами числа в его позиционной записи называются все его 
цифры, начиная с первой ненулевой слева. Значащую цифру 
приближенного числа называют верной, если абсолютная по- 
грешность числа не превосходит единицы разряда, в котором 
стоит эта цифра (или половины единицы; в этом случае иногда 
применяется термин верная в узком смысле). 


Чтобы результаты арифметических действий, совершаемых 
над приближенными числами, записанными в соответствии с 


* , 2 
) Крылов Алексей Николаевич (1863—1945). 
*#ж* 
«В среднем» здесь понимается в вероятностном смысле. 
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принципом А. Н. Крылова, также соответствовали этому прин- 
ципу, нужно придерживаться следующих простых правил [25, 
44, 61, 98]: 

1) ири сложении и вычитании приближенных чисел в ре- 
зультате следует сохранять столько десятичных знаков, сколь- 
ко их в приближенном данном с наименьшим количеством деся- 
тичных знаков; 

2) при умножении и делении в результате следует сохра- 
нять столько значащих цифр, сколько их имеет приближенное 
данное с наименьшим числом значащих цифр; 

3) результаты промежуточных вычислений должны иметь 
один-два запасных знака (которые затем должны быть отбро- 
шены). 

Таким образом, при техническом подходе к учету погреш- 
ностей приближенных вычислений предполагается, что в самой 
записи приближенного числа содержится информация о его точ- 
ности. И хотя прямая выгода от применения приведенных правил 
работы с приближенными числами может быть получена лишь 
при ручном счете (не нужно оперировать с цифрами, не влияю- 
щими на информативную часть приближенного результата), их 
знание и понимание помогает правильной интерпретации ком- 
пьютерных расчетов, а иногда и самой организации таковых. 


1.3. ПОНЯТИЕ О ПОГРЕШНОСТЯХ 
МАШИННОЙ АРИФМЕТИКИ 


Для представления вещественных чисел в компьютере при- 
меняют, в основном, два способа: с фиксированной и с плаваю- 
щей запятой (точкой). 

Пусть в основу запоминающего устройства машины поло- 
жены однотипные физические устройства (базисные элементы), 
имеющие г устойчивых состояний (как правило, г=2, 8,16 
ит.п.), причем каждому числу ставится в соответствие одинако- 
вое количество А этих элементов и, кроме того, с помощью та- 
ких или более простых элементов может фиксироваться знак. 
Упорядоченные элементы образуют разрядную сетку машинного 
слова: в каждом разряде может быть записано одно из базисных 
чисел 0, 1 й ‚ г-1 (одна из г «цифр» г-ичной системы счисле- 
ния) и в специальном разряде отображен знак + или —. 

При записи числа с фиксированной запятой кроме упомя- 
нутых г параметров (основания системы счисления) и К (коли- 
чества разрядов, отводимых под запись цифр числа) указывается 


еще количество / разрядов, выделяемых под дробную часть 
числа. Таким образом, положительное вещественное число а, 
представляющее собой в "-ичной системе бесконечную, вообще 
говоря, непериодическую дробь, здесь будет отображено конеч- 
ной последовательностью 


ой а е-ьй к, 
где а; Е {0,й ‚г-П, т.е. реализуется приближенное равенство 


а= Ях(а) = а" И чер? +6 чарт + 


1 


0 ча“, 


Чит +20 +арл". 


Диапазон представляемых таким способом чисел определя- 
ется числами с наибольшими цифрами во всех разрядах, т.е. наи- 
меньшим —(^-1)("-1)6 (--1) и наибольшим ("-1)("-1)6 ("-1) 
числами, а абсолютная точность представления есть оценка 
величины |а-Ях(а)|, зависящая от способа округления: это к”! 
при простом отбрасывании «хвоста» 

—(1+1) 
Я р-г 


при правильном округлении (се. при увеличении @ на единицу, 


= э > 
+ @у+2г (+2) п числа а и половина этой величины 


х 
если +1 5 Заметим, что абсолютная точность представления 


вещественных чисел с фиксированной запятой одинакова в лю- 
бой части диапазона. В то же время относительная точность, 
а-Нх(а) {или а-йх(а) 
а Ях(а) 

жет значительно различаться в зависимости от того, берется а 
близким к нулю или к границе диапазона. Иными словами, веще- 
ственные числа с фиксированной запятой имеют равномерную 
абсолютную плотность распределения на всем отрезке вещест- 
венной оси, определяемом границами диапазона, и неравномер- 
ную, возрастающую к границам отрезка, относительную плот- 
ность распределения. 

В основе значительно чаще употребляемого представления 


с плавающей запятой лежит следующая экспоненциальная 
форма записи вещественного числа: 


а=М.гР, 
где г —[ основание, р — порядок, а М такое, что 


т.е. оценка величины ) очевидно, мо- 


1 < М | < 1 =о) — мантисса. Если под мантиссу выделяется / 
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"-ичных элементов, а под порядок 71, то в системе записи с пла- 
вающей запятой вещественное число а представляется конечным 
числом Й(а) (от англ. Йоайпе — «плавающий») вида 


а= (а) = (ви! + В"? +в +В!) »7, 


ге у — целое число из промежутка В”, кт 1]; 
ВЕЙ,й ‚,г-1; В, Е{0, 1Й ,г-П (1=2,й ,[), те. машинное 
слово условно имеет структуру: 


Знак Знак 
порядка Порядок мантиссы Мантисса 


т разрядов [ разрядов 


„т 
Числа +г” определяют границы допустимого числового 
диапазона. Более информативно здесь нужно говорить о диапа- 
зоне представимости положительных вещественных чисел, со- 


ит т_ 
ставляющем промежуток [- и” "| Левую и правую границы 
этого отрезка называют соответственно машинным нулем и 
машинной бесконечностью, так как числа из промежутка 


г 


т „т 
[-, ы Е ь ] машина заменяет нулем, а числа, лежащие за пре- 


т „т_ 
делами промежутка [--” > и она не воспринимает (без 


специальных ухищрений). 

Важной характеристикой является число &, называемое 
машинный эпсилон и обозначаемое обычно идентификатором 
тасйеру. Эта характеристика определяется как расстояние между 
единицей и ближайшим следующим за ней числом системы ма- 
шинных чисел с плавающей запятой. Так как 


тео." чи чй =, 
а следующее за 1 машинное число есть 
(1..1 +0-72+й +0. +1-, 7“). 1 = (1+ =), 
то за тасйеру можно принять величину 
ЕЕ ЕР, 


Это число непосредственно связано с относительной погрешно- 
стью представления чисел в системе с плавающей запятой. Имеем: 


НИ, —(/ = 
аа _ бат О а Ре И 5) 
а 


В+ В" +6 ди 
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Таким образом, машинный эпсилон служит мерой относи- 
тельной точности представления вещественных чисел, причем 
эта точность одинакова в любой части числового диапазона и за- 
висит лишь от числа 7 -ичных разрядов, отводимых под мантиссу 
числа. В то же время оценка абсолютной погрешности 


в - На] =4-""" 


показывает, что расстояние между вещественными числами и 
конечными приближениями к ним в системе с плавающей запя- 
той неодинаковы в разных частях числового диапазона: абсо- 
лютная плотность машинных чисел больше вблизи нуля при оди- 
наковой относительной плотности их распределения. 


Замечание 1.1. Если трактовать тасйеру как минимальное поло- 
жительное действительное число, прибавление которого к 1 дает следую- 
щее за | число с плавающей запятой, то, очевидно, при правильном ок- 
руглении значение тасйерх будет в два раза меньшим. Действительно, 


[ Я= = 
полагая = =" : и (1+1) в получаем 


= +0. 2 +й +0-к 7 не 


и, значит, Я(1+=)=1+^71>1. «Мера дискретности» множества машин- 


ных чисел, как видим, остается той же: и $ 


Замечание 1.2. Величина тасйеру служит оценкой относительной 
точности представления вещественного числа а при условии, что 


2 ат р 
|4>г'’. Если же ае | „.Й ‚ то Я(а)=0 и, значит, относи- 
тельная погрешность 
а- Н(а) 
АЕ, 
а 


т.е. является постоянной достаточно большой величиной, в то время как 


„т 


абсолютная погрешность не превосходит величины и” 


Приведем значения введенных выше теоретических пара- 
метров для нескольких типов отечественных ЭВМ (электронно- 
вычислительных машин) 60-80 гг.*) (реальные параметры, есте- 
ственно, могут незначительно отличаться от приводимых) [3, 6, 
50, 54, 158]. 


*) В качестве упражнения читателю предлагается составить неслож- 
ную программу, которая позволит получить соответствующие параметры 
используемого им современного компьютера. В готовом виде такую про- 
грамму можно обнаружить в книге [68]. 
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Так, для записи числа в 48-разрядном машинном слове 
БЭСМ-6 40 двоичных разрядов выделяются под мантиссу, 6 — 
под порядок и 2 — под знаки мантиссы (т.е. числа) и порядка. 
Отсюда, принимая ’=2, [=40, т=б, получаем, что точность 
представления чисел с плавающей запятой на БЭСМ-6 не хуже 


Ре” ‚ граница машинного нуля м ‚ машинной 


бесконечности 263 =1019 й 


Машинное слово СМ ЭВМ имеет 32 двоичных разряда, из 
которых под мантиссу выделяется 24, а под порядок — 7. Зная 


параметры и=2, [=24, т=7, получаем тасйеру = 2-28 510" ; 


машинные нуль и бесконечность = 10338. 
На ЕС ЭВМ используется представление вещественных чи- 
сел по основанию г’=16. Эти машины имеют относительную 


точность представления =10-7 и диапазон для положительных 
чисел =10777 +1075. 

Практически любая машина ЕС ЭВМ рассчитана на то, что- 
бы выделить под запись числа двойное машинное слово, что по- 
зволяет более чем вдвое увеличивать точность представления. 
Двойная точность предусматривается также многими языками 


программирования. 


Обращаясь к арифметическим операциям над машинными 
числами, прежде всего заметим, что они утрачивают привычные 
свойства. Особенно это касается свойств ассоциативности и ди- 
стрибутивности, нарушаемых при выполнении арифметических 
операций на любых ЭВМ (сохранение или несохранение свойст- 
ва коммутативности связывают со способом округления чисел). 
Так, весьма утрированный пример сравнения выражения 

ЕЯ эВ | на свыражением 2/2 ел 07 


) 


где 2) таково, что во —ШЩ правая граница числового диапазона, 
показывает существенность способа расстановок скобок при ум- 
ножении: в первом случае машина выдаст сообщение о перепол- 
нении, в силу 


„В12 „3514 „ „В. 


а во втором — будет получен правильный результат. Легко также 
представить ситуацию с тремя положительными числами а, Б, с, 


когда расставляя по-разному скобки в выражении а+Б-с, будем 
получать (или не получать вовсе) разные результаты. 


Изучение погрешностей результатов арифметических опе- 
раций над числами с плавающей запятой производят с помощью 
представления 
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П(а)=а(1+9), где |6|<тасйеру (1.6) 


(чтобы убедиться в справедливости (1.6), достаточно ввести д 


Я(а)-а 


и воспользоваться доказанным в (1.5) неравенством 
|6] < тасйеру). Принимая во внимание, что операции над двумя 
машинными числами а и Ь осуществляются точно (здесь ис- 
пользуется двойная длина машинного слова), после чего произ- 
водится округление, результат любой арифметической операции 
© также может быть записан в виде 
Я(а®Ь)=(а®5) +51), (1.7) 

где [61| < = (за исключением особых случаев). 

Пусть складываются последовательно три положительных 
числа а1, а2, аз. Тогда, согласно (1.7), 


Я(ат + а›) = (а +а› {1+ 61), 


равенством д = ‚ равносильным фигурирующему в (1.6), 


где |61|<=; 


Я (а +а›)+аз) = ((а1 + а› {1+ 61) +аз)1+ 62) = 
= (аи +а› {1+ 61 {1+ 6›)+аз1 +62), 


где |5; <= (1=1, 2). 
Заменяя здесь д; бблышим значением =, получим оценку 
абсолютной погрешности суммы трех слагаемых: 


| Я(ат + а› +аз)- (а +а› +аз)< 2(а1 +а2)Е + азё + (а +42)”. 


Обращает на себя внимание неравноправность слагаемых в обра- 
зовании погрешности суммы: меньшую роль в ней играет по- 
следнее слагаемое. Природа этого факта очевидна: первые сла- 
гаемые неявно (в просуммированном виде) участвуют в процессе 
каждого последующего сложения. 

Если пренебречь степенями = выше первой, то для сум- 
мы и положительных чисел а; нетрудно получить [6] прибли- 


женную оценку абсолютной погрешности вида*) 


5("-1 (а +4)+(п-2) аз +...+2а,1+а„|-= 


* 
) Здесь и далее знак « <» используется для обозначения неравенства 
в смысле главных (линейных) частей. 
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при последовательном суммировании, начинающемся с а1. Оче- 
видно, чтобы эта погрешность была минимальной, последова- 
тельность чисел нужно суммировать в порядке возрастания 
членов. Только за счет этого можно добиться уменьшения по- 
грешности, как показано в [42], в и/105› и раз. 

На основе изучения погрешности произведения нескольких 
чисел строятся алгоритмы оптимального умножения. Пусть тре- 
буется перемножить и чисел а; таких, что |а!|<|а>|<...<|а„|. 
Погрешность произведения будет минимальной, если находить 
его по схеме: умножать а! последовательно на а„, аи, ... до тех 


пор, пока модуль частичного произведения не станет большим 
единицы, затем это частичное произведение умножать на а, 
аз, ... до тех пор, пока новое частичное произведение не станет 
по модулю меньшим единицы, и так далее до исчерпывания всех 
сомножителей [42]. 

Естественно, что расплатой за выигрыш в точности при реа- 
лизации таких алгоритмов будет проигрыш в скорости счета. 


1.4. ПРИМЕРЫ НЕУСТОЙЧИВЫХ 
ЗАДАЧ И МЕТОДОВ 


В силу неизбежного появления погрешностей в исходных 
данных задачи (в процессе создания математической модели изу- 
чаемого объекта или явления), а также погрешностей округления 
при ее решении, следует иметь представление о том, насколько 
чувствительными могут оказаться сами задачи и методы их ре- 
шения к таким погрешностям. Рассмотрим несколько примеров 
проявления чрезмерной чувствительности. 


Пример 1. Пусть требуется найти вещественное решение 
уравнения 


(х-а)" ==, 


где = —[ очень малое положительное число, а натуральное ип 
достаточно велико. Тогда естественно заменить = нулем и поло- 
жить х=а. Так как точное решение данного уравнения есть 


х=а+\= ‚ то абсолютная погрешность при таком подходе соста- 
вит величину У=. Много это или мало — судить об этом можно, 


придавая & и и численные значения. Например, взяв &=№- В. 
п=10, получим абсолютную погрешность значения корня хх=а, 
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равную 0.1. Относительная погрешность при этом может ока- 
заться сколь угодно большой, если а взять сколь угодно малым. 


Пример 2 (пример Уилкинсона [3, 6, 75, 179 и др.]). Мно- 
гочлен 

Руд (х) = (х-(-2)й (х-20)=х20 2109 +й +20! 
имеет 20 хорошо отделимых действительных корней 

Х1 = № 9 й ‚› ^20 =.20. 

Предположим, что только в одном его коэффициенте, а именно, 
при х ° сделана ошибка порядка тасйерз: вместо —210 в развер- 
нутый вид многочлена Р›о(х) подставлено число — (210 + ое )= 


=-(210+10-7). Полученный при этом так называемый возму- 
щенный многочлен будет иметь следующие корни (ограничимся 
записью трех цифр после запятой): 


Хх] =1.000, Х6 = 6.000, Х12.13 =11.794+1.6521, 
х =2.000, х=7.000, х1415 =13.992+2.5191, 
хз =3.000, ж=8.007, х1617 =16.731+ 2.8131, 
хд = 4.000, хо =8.917, х18.19 = 19.502 +1.9401, 


х5=5.000, хо! =10.095+0.644, ход =20.847. 


Как видим, весьма малое возмущение (сопоставимое с точ- 
ностью представления чисел в некоторых ЭВМ) всего лишь в од- 
ном коэффициенте даже качественно изменило набор корней 
данного многочлена: половина из них перестали быть действи- 
тельными. 


Пример 3. Линейная система 
х + 10у И, 
100х + 1001у = 1101 


имеет единственное решение х=1, у=-1. Допустив абсолютную 
погрешность в 0.01 в правой части одного уравнения, получим 
возмущенную систему 


х +10 =1.01, 
100х + 1001у = 1101 


с единственным решением х=11.01, у=0. Последнее никак не 
назовешь близким к решению исходной системы. 
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Пример 4. Для вычисления определенных интегралов вида 


11 
7; =-|х”е”ах, 
бо 
где ие М, с помощью метода интегрирования «по частям» легко 
вывести рекуррентную формулу 


Г. =1-й1, 0 п =1- (1.8) 
е 


В [0] приведена сводная таблица результатов подсчета /„ 
при и=0,1,2,й ‚14 по формуле (1.8), полученных в 60-х годах 
на разных вычислительных машинах в Чехословакии, Восточной 
Германии, России. Эта таблица наглядно демонстрирует рост 
разброса значений интеграла при увеличении значения и. Не 
приводя здесь полностью этих результатов, отметим лишь, что 
при и=14 спектр вычисленных значений интеграла /14 лежит в 
границах от —148 до 5356. Несмотря на то, что на некоторых 
ЭВМ вычисления велись с мантиссами, имеющими более десяти 
десятичных разрядов, ни один результат не имел ни одной вер- 
ной цифры! Причина подобного явления — в численной неус- 
тойчивости схемы (1.8). Безупречная в теоретическом плане, т.е. 
с точки зрения аналитической математики, она совершенно не- 
пригодна с позиций вычислительной математики, поскольку не- 
избежная погрешность стартового значения /о при подсчете /„ 


увеличивается в и! раз, т.е. катастрофически нарастает. 


Если примеры 1-3 указывали прямо на существование 
неустойчивых задач»), то в четвертом примере видно яркое про- 
явление неустойчивого метода вычислений. Последним, как 
правило, есть альтернативы. Например, для вычисления рассмат- 
риваемого там интеграла /„ при конкретном значении и можно 
применять квадратурные формулы, т.е. формулы, специально 
приспособленные для приближенного вычисления определенных 
интегралов. А можно воспользоваться и равенством (1.8), только 
переписать его в виде 


1 
=> @-1). (1.9) 


* = в 
) См. также пример неустойчивой задачи на собственные значения 
для их и-матрицы в $ 4.5. 
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Учитывая, что 0</,„.1</» и а» 0, для подсчета /„ при 


некотором фиксированном и=А (и для меньших этого К индек- 
сов) можно задаться значением /х :=0 и вести счет по форму- 
ле (1.9) при и=М№, М-ЬЙ , К-1. Так как начальная погрешность 
на каждом шаге теперь уменьшается в и раз, то такой алгоритм 
будет численно устойчивым. Значение № при этом может быть 
определено теоретически или экспериментально [6, 10]. 

Более подробно тема устойчивости и неустойчивости задач и 
методов развивается при изучении численных процессов решения 
дифференциальных уравнений (см. гл. 16, а также $$ 2.6, 13.3, 17.3, 
18.1, 20.2). Для решения задач, требующих особого учета возму- 
щений и обобщения самого понятия решения, в последние не- 
сколько десятилетий разрабатываются особые подходы, приво- 
дящие к построению специальных устойчивых численных мето- 
дов, называемых методами регуляризации. Первые представления о 
таких методах можно получить из $ 1.7. 


1.5. ОБУСЛОВЛЕННОСТЬ ЛИНЕЙНЫХ 
АЛГЕБРАИЧЕСКИХ СИСТЕМ 


Учитывая распространенность систем линейных алгебраи- 
ческих уравнений (ибо часто именно к ним сводится на опреде- 
ленном этапе процесс математического моделирования), попыта- 
емся количественно охарактеризовать степень неопределенности 
этих задач. Знание таких характеристик позволяет обоснованно 
судить о корректности моделей, грамотно подбирать методы и 
строить алгоритмы, правильно трактовать полученные результаты. 

Рассмотрим линейную алгебраическую систему, записан- 
ную в виде векторно-матричного уравнения 


Ах=Ь, (1.10) 
где А — невырожденная ихи-матрица коэффициентов данной 
системы; 6 — ненулевой и-мерный вектор свободных членов; 
х — и-мерный вектор неизвестных (решение, если трактовать 


(1.10) как верное равенство). 

Пусть правая часть (1.10) получила приращение («возмуще- 
ние») ДБ, т.е. вместо истинного вектора Ъ используется прибли- 
женный вектор Б+ЛЬ. Реакцией решения х на возмущение ЛЬ 
правой части будет вектор поправок Ах, т.е. если х — решение 
(1.10), то х+Ах — решение уравнения 


А(х+Лх)=Ь+ЛЬ. (1.11) 
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Понимая „под абсолютной погрешностью приближенного 
вектора норму”) разности между точным и приближенным век- 
торами, а под относительной погрешностью — отношение абсо- 
лютной погрешности к норме вектора (точного или приближен- 
ного), выясним связь между относительными погрешностями 
вектора свободных членов и вектора-решения. Иначе, получим 
оценку вида 

ПЗ оАЫ 


| |Ы ° 
где ||. | — какая-либо векторная норма, а (?) — неизвестный пока 
коэффициент связи. 
Подставляя (1.10) в (1.11), видим, что поправка Ах связана 
с возмущением ДЬ таким же, как и (1.10), равенством 
АЛх=дЬ, 
из которого находим ее явное выражение 
Ах=А-ПАЬ. (1.12) 
Нормируя равенства (1.10) и (1.12), будем иметь 
= 
ПЫАНЫ и ПАХА” МАЫ, 


где матричная норма должна быть согласованной с выбранной 
векторной нормой. Эти два числовых неравенства одинакового 
смысла можно перемножить: 


Е 
НАУ =ПАНЫЧАЯЧАы. 
Из последнего делением на ||®]|||х| получаем искомую связь 


Аз] АА 
т АА (1.13) 
[1 ы 
Положительное число АНА” | — коэффициент этой связи — 


называют числом (мерой) обусловленности матрицы А и 0бо- 
а сопа А (от английского слова соп4Июопей — «обусловлен- 
ный»)"*). Распространены также обозначения у(А), 7(А), (А). 


* 
) См. приложение 1. 
* 
Имеется более общее определение числа обусловленности [194]: 


Ах А 
сома зар ИАЗ [ие АЯЙ, 
а МИ 


Здесь сопаА задается через векторные нормы и может быть приме- 
нено к вырожденным матрицам А. В случае обратимых матриц А при 
использовании согласованных матричных норм отсюда получается 


—1 
сопа А = АА". 
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Легко показать, что то же самое число соп4А АА” | 


служит коэффициентом роста относительных погрешностей при 
неточном задании элементов матрицы А в (1.10). А именно, если 
матрица А получила возмущение ЛА и х+Ах — решение воз- 
мущенной системы 


(А+ЛА)(х+ Ах) =Ь, 


то справедливы неравенства 
[АА] 


АЗ над. ВА. И стал. РА : (1.14) 
ы [А +4А| К+ Ах] А] 


Замечание 1.3. Можно получить оценки, обобщающие в опреде- 
ленном смысле (1.13) и (1.14) в случае одновременного возмущения мат- 
рицы А системы (1.10) и ее правой части Ь. Более того, величина 


у(А):= АА] является также мерой обусловленности линейного об- 


ратимого оператора А в произвольном нормированном пространстве. 
Справедливо следующее утверждение [177]. 


Теорема 1.1. Пусть Ах=Ь — данное, а Ах=Ь — возмущен- 

ное линейные операторные уравнения с относительными уровнями 
АА], „РМ 

возмущений дд >" идбь>————\. Тогда, если бду(А)<1, то 


[А] Ы] 


эти уравнения одновременно однозначно разрешимы и справедлива 
оценка относительной погрешности решения, имеющая вид 


|х-х| < "А) р у2(А) | 
№ 1 0^-5(А) Р`1-5А-5(А) ^` 

Итак, неравенства (1.13) и (1.14) показывают, что чем боль- 
ше число обусловленности, тем сильнее сказывается на решении 
линейной системы ошибка в исходных данных. Грубо говоря, ес- 
ли сопд А = О(10Р) и исходные данные имеют погрешность в /- 
м знаке после запятой, то независимо от способа решения систе- 
мы (1.10) в результате можно гарантировать не более /— р знаков 
после запятой. 

Если число соп4 А велико, то система считается плохо обу- 


словленной. Говорить о том, «что такое хорошо и что такое пло- 
хо», в отрыве от контекста решаемой задачи почти бессмыслен- 
но, так как здесь может играть роль размерность задачи, точ- 
ность, с которой должно быть найдено ее решение, точность 
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представления чисел в ЭВМ и т.п. Однако можно дать оценку 
снизу числа обусловленности. А именно, если используются 
подчиненные матричные нормы (для которых норма единичной 
матрицы есть единица), то, очевидно, 


сопЧ А =[А| [А |>[А-А “ЕЕ =1, 


т.е. число обусловленности не может быть меньше 1. Можно 
также указать верхнюю границу для чисел обусловленности, 
превышение которой при решении линейных систем на конкрет- 
ной ЭВМ может привести к заведомо ложным результатам. Так, 


— 
решение считается ненадежным, если соп4 А >(тасйеру) или 


даже соп4 А>(тасйерз). 95 [68]. При этом заметим, что масшта- 
бированием матрицы А путем умножения на скаляр & ее обу- 
словленность не улучшить, ибо 


соп4 (мА) = |@А| |)” | = АА” | = соп4 А. 


Приемы более-менее эффективного масштабирования линейных 
систем вида (1.10), повышающего устойчивость их решений, 
можно найти, например, в [71]. 

Классическим примером плохо обусловленной матрицы яв- 


* 
ляется так называемая матрица Гильберта”) 


1 И 
Н, (== ‚ 
1+] —1 ьы 


демонстрирующая катастрофическое возрастание числа обуслов- 
ленности с ростом размерности [138, 183]. Так, уже при и=8 


сопа Нз >1010 и обратная матрица НХ, полученная на машине 


с точностью представления чисел порядка 16-5, может не содер- 
жать ни одного верного знака. 

Очевидно, число обусловленности зависит от выбора мат- 
ричной нормы (индуцированной, как правило, той или иной век- 
торной нормой, в терминах которой характеризуется относи- 
тельная погрешность решения алгебраической системы). Однако 


к Эта матрица — не просто плод воображения. Ее появление зако- 
номерно, например, при нахождении коэффициентов многочленов наи- 
лучшего среднеквадратического приближения методом наименьших квад- 
ратов ($ 10.3). 
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нетрудно получить оценку числа обусловленности через собст- 
венные числа матрицы. Действительно, пусть собственные числа 
Я; матрицы А упорядочены по модулю: 


И|>2|> # >Ин|, 


т.е. спектральный радиус матрицы А есть рд =|й1|. Тогда в силу 
известного неравенства рд <|А| и соотношения между собст- 
венными числами прямой и обратной матриц, имеем 


АА“ РА -Рлз ИТ 


Таким образом, оценкой снизу меры обусловленности матри- 


цы А может служить величина ый (называемая иногда числом 
И 

обусловленности Тодда [РЖМат, 1983, 105937] или Тодта 
[126]). Для симметричных матриц эта оценка и на самом деле яв- 
ляется числом обусловленности, соответствующим спектральной 
норме матрицы (индуцированной евклидовой нормой вектора). 
Учитывая смысл собственных чисел матрицы, можно сказать, 
что число обусловленности показывает величину отношения 
наибольшего коэффициента растяжения вектора посредством 
линейного преобразования А к наименьшему. 

Следует отметить, что непосредственный подсчет чисел 
обусловленности, особенно при большой размерности матриц, 
является весьма дорогостоящим делом из-за необходимости об- 
ращать матрицы или находить их собственные значения. Поэто- 
му зачастую о приемлемости порядка возможного роста относи- 
тельной погрешности результата решения какой-либо алгебраи- 
ческой задачи относительно данной матрицы судят либо по ка- 
ким-то достаточным признакам (например, по доминированию 
элементов главной диагонали матрицы), либо на основе теорети- 
ческого изучения матрицы [138, 152], либо путем применения 
специальных алгоритмов приближенного оценивания соп4а А 
[68, 127, 184]. Исследование матриц на обусловленность может 
быть естественным образом связано со способом решения той или 
иной алгебраической задачи относительно данной матрицы. 


Прокомментируем теперь пример неустойчивой системы, 
приведенной в примере 3 $ 1.4. 
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Матрица коэффициентов системы А -( 


Е г. —10 


1 0 
имеет об- 
100 1001 


ратную А = 
—100 1 
сти в матричной норме, индуцированной векторной нормой- 


максимум (иначе, нормой /[„,), есть 


| Следовательно, число обусловленно- 


",(А)=1101-1011=1113111>105. 


И 0.01 
Учитывая, что в данном примере ь-| а ль-| 0 } на ос- 


нове (1.13) получаем оценку относительной погрешности реше- 
ния В /„-нормах 


9 А-Я ТН О, 
1101 
1 
Так как норма-максимум решения <} равна 1, оценка абсо- 


лютной погрешности |Ах| решения равна 
[^х| = |х|. 5х <1041. 


11.01 
Как видим, решение х+Ах -( о возмущенной системы впи- 


сывается в оценку 


[5+ Ах] [5-х] < 1+10.11=11.11. 


Аналогичный результат может быть получен через число 
обусловленности Тодда. Решая характеристическое уравнение 


42 —10024+1=0, 


находим собственные числа матрицы А: 41=1002 и 
#2 = 0.000998, дающие оценку 


соп4А ыт =1004000 >105. 
2 


На данном примере также можно наглядно убедиться в том, 
что малость невязки г=Ъ-Ах плохо обусловленной системы 
еще не говорит о близости приближенного решения х к точно- 
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» [10 
му х. Действительно, невязки г и г› векторов х| - о и 


Е. 1 
Хх) -(. } для основной (невозмущенной) системы из примера 3 


$ 1.4 имеют нормы соответственно ||. =0.01 и |||, =100.1. 


= | = 
Вектор х› , явно более близкий к точному решению х = | ‚ чем ху, 


имеет существенно большую невязку! Объяснение этому пара- 
доксальному, на первый взгляд, факту можно найти в книге [26]. 

Двумерный случай допускает простую геометрическую 
трактовку понятия обусловленности. Плохая обусловленность 
системы двух уравнений с двумя неизвестными означает, что 
прямые, являющиеся геометрическими образами уравнений, пе- 
ресекаются на координатной плоскости под очень острым углом. 
В этом случае небольшое искажение в данных, интерпретируе- 
мое как параллельный перенос (при возмущении свободного 
члена) или поворот прямых (при возмущении матрицы коэффи- 
циентов), приводит к значительному перемещению их точки пе- 
ресечения, т.е. геометрического образа решения. 


1.6. ПОГРЕШНОСТИ КОРНЕЙ СКАЛЯРНЫХ 
УРАВНЕНИИ С ПРИБЛИЖЕННЫМИ 
КОЭФФИЦИЕНТАМИ 


Пусть решается алгебраическое или трансцендентное урав- 
нение вида 


Л(х)=0. (1.15) 


Это уравнение, являясь нелинейным, может иметь один или не- 
сколько корней или не иметь их вовсе. Каждый корень так или 
иначе зависит от числовых данных уравнения (1.15). Эти число- 
вые данные (будем иногда называть их коэффициентами уравне- 
ния) можно считать фиксированными значениями параметров, 
т.е. уравнение (1.15) целесообразно рассматривать в качестве 
представителя семейства уравнений 


Яо, ар ай ‚ат)=0 (1.16) 


и наличие корней у (1.15) связывать с существованием неявной 
функции х=9(а1, а>2,й ‚а») при данном наборе значений пара- 
метров (коэффициентов) а1, а2,й ‚ат. Поскольку эти числа, как 
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правило, точно не известны (грубость модели, неточность изме- 
рений, усечение чисел при вводе в ЭВМ ит.п.), встает вопрос о 
том, как влияет погрешность коэффициентов уравнения (1.15) на 
погрешности его корней. Иначе, с какой точностью имеет смысл 
решать данное уравнение, если известно, что его коэффициенты 
не точны, но имеется информация об уровне их погрешностей? 
Реально можно оценить лишь главную часть погрешности 
корня, понимая под ней, как ив $ 1.1, модуль дифференциала. В 
данном случае речь идет о дифференциале неявной функции не- 
скольких переменных. Подходящую основу для этого находим в 
математическом анализе: если, например, выполняются условия, 
при которых уравнение Е(х, у,2)=0 неявно определяет диффе- 
ренцируемую функцию 2 = 2(х, у), то выражение дифференциала 
42 этой функции можно получить из равенства АЁ = 0, а именно, 


1 ! и! 
42 = ея Еу4). 


Аналогично, если х=9о(а, ай аи) — корень уравне- 
ния (1.16), то линейная часть его изменения, соответствующая 
изменениям аргументов — коэффициентов ат, а2,й ‚ат, равна 


ГЕ 27 дач 27 Чар +й + = Чат 
27 \ ба ба дат 


Переходя здесь к модулям и заменяя истинные абсолютные по- 
грешности коэффициентов Ла; (= Ча; |) их оценками Д.,, полу- 


чим формулу для оценки абсолютной погрешности корня: 
1 12) 9 [2 
< АА АА ча А || (7 
ол ба: ? ба> ь ба ыы 


т 
дх 


Заметим, что при вычислении значений частных производных в 
(1.17) следует пользоваться фиксированными значениями коэф- 
фициентов а1,а2,й ‚а» (такими, какими они используются при 
нахождении корня) и приближенным значением того корня, сте- 
пень неопределенности которого устанавливается. Ясно, что для 
разных корней одного и того же уравнения значения этой вели- 
чины могут сильно различаться. 

Следуя [72], получаемую с помощью (1.17) оценку будем 
называть безусловной абсолютной погрешностью приближен- 
ного корня х уравнения (1.16) с приближенными коэффициента- 
ми и обозначать б.п. х. Это же х есть точный корень уравнения 
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(1.15), в то время как при численном решении уравнения вместо 


х будет получено некоторое приближение к нему х. Возникаю- 
щую при этом остаточную погрешность или погрешность метода 
назовем условной погрешностью и обозначим у.п. х. 

Итак, в ходе численного решения уравнения (1.15) в пред- 
положении, что его коэффициенты точны, находится прибли- 
женный корень х с условной погрешностью у.п. х. Это означает, 
что точный корень х уравнения (1.15) при данном предположе- 
нии лежит на интервале (х —у.п.х, х+у.п.х). Зная погрешности 
коэффициентов и приближенный корень Хх, можно подсчитать 

* 
безусловную погрешность 6.п.х. Истинная величина корня х 
уравнения с приближенными коэффициентами — это потенци- 
ально любое число из интервала (х — б.п.х, х + б.п.х). Ясно, что 
* м 
гипотетическое значение х — решение рассчитываемой модели 


— может отличаться от реально полученного значения Х на ве- 
личину у.п.х + б.п.х, т.е. полная погрешность корня уравнения с 
приближенными коэффициентами складывается из погрешно- 
стей условной и безусловной. Так как величиной условной по- 
грешности распоряжается вычислитель, причем ее уменьшение в 
разумных пределах не вызывает, как правило, больших затруд- 
нений, то обычно, чтобы не увеличивать полную погрешность 
корня приближенного уравнения, условную погрешность задают 
неравенством 

улььх: < бнх (1.18) 
или даже 


у.п.х < 0.1 6.п.х. 


Если воспользоваться правилом Ньютона*) оценки близо- 
сти приближенного корня (нуля) х дифференцируемой функции 
1 (х) к точному корню х 

= х 
&-х <5@) (1.19) 


15) 


_*) По формуле конечных приращений Лагранжа при некотором 
9=(х, х) (или (х, х)) для дифференцируемой функции /(х) выполняется 
равенство 


/(®)- гс) = ге) -х). 
Предполагая, что х — корень, х =х, азначити 9=х, имеем 


Де) (Ех), 


откуда следует правило Ньютона (1.19). 
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и оценкой (1.17), то можно на основе (1.18) получить простой 
критерий окончания процесса численного решения скалярного 
уравнения (1.15) с приближенными коэффициентами: 


‘уточнение корня х =х ведется до тех пор, пока не выпол- 
нится условие 
— 72. 72. 
У] 2 А, +[2^ 
ба] 7.) 


а2 


Ад, +й +27, (1.20) 
р бат т 


Как видим, большую роль в неравенстве (1.20) играют модули 
частных производных данной функции по параметрам, называе- 
мые коэффициентами чувствительности. 


В случае, когда уравнение (1.15) — алгебраическое, т.е. 
10) =Р@):= абх" +ах" 1+й +аи1х+аи, (1.21) 
его корни — функции коэффициентов многочлена а, а1,й ‚а, а 
х" «В 
получающиеся при подстановке сюда вместо х приближенных 


корней многочлена. Неравенство типа (1.20), закладываемое в 


процесс уточнения корня х многочлена (1.21) с приближенными 
коэффициентами аб (+ Ад }, а (+ Ад Ъ п ‚а, (Ах, }, имеет вид 


|Р(:]< | я 


Легко заметить, какую роль играют погрешности тех или иных 
коэффициентов в зависимости от того, малы или велики модули 
корней. 

Получим, наконец, связь между относительными погрешно- 
стями коэффициентов и корней многочлена. 

На основе оценки (1.17) для многочлена (1.21) имеем 


коэффициенты чувствительности суть числа к” 


) 


и-1 


Аа, + 


да + +, + Аа, 


п | ор И и 3 
А р ба, Да, р" | а ба, Ух" "ба, 
бх=Е о 0 о 
х 9. РР = в п 
Ох М: У. (и-Ла,х У (и-Пах 
1=0 1=0 


Если сделать допущение, что все коэффициенты многочлена 
имеют одинаковый уровень б относительных погрешностей, или 
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положить тах да =0, то для граничной относительной по- 
1 
1=0, ‚п 


грешности 6, простого ненулевого корня х будем иметь при- 
ближенную оценку 


р, а; х 
6, > (1.22) 
у (п — В а; 6 
1=0 
Коэффициент 
и и—Й 
ха, х 
1=0 
ух и—1 
У(и-Ва,х"" 


связи (1.22) относительных погрешностей корней и коэффициен- 
тов (для каждого корня свой) по аналогии с терминологией пре- 
дыдущего параграфа естественно назвать числом или мерой обу- 
словленности ненулевого простого корня”) многочлена с при- 
ближенными коэффициентами. 


Замечание 1.4. В книге [75] мерой обусловленности простого корня 
х=х(а1, а2,й ‚ а„) многочлена (1.21) с ад =1 считается норма градиента 
& м Ге. 
—;—5й;—_|. Если все корни х|, х2,й ‚ х„ — простые, то обу- 
а 2) бя И 
словленность многочлена характеризуется нормой матрицы Якоби 


Обращаясь к примеру Уилкинсона в $ 1.4, с помощью под- 
счета чисел обусловленности корней можно грубо объяснить 
картину разного влияния на разные корни внесенного в один ко- 
эффициент малого возмущения. Если для первого корня число 
обусловленности у, = 400, то с увеличением номера корня это 
число значительно возрастает, достигая, например, на пятнадца- 


том корне величины большей, чем 1010. Последний (двадцатый) 


* 
) В случае нулевого или кратного корня Х знаменатель дроби об- 
ращается в нуль. 
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корень имеет меньшее, чем предыдущий, число обусловленно- 
сти, сравнимое с величиной Утасйерх (значения несколько ина- 
че определенных чисел обусловленности можно найти в [3]). 
Отметим, что в числителе выражения для подсчета числа 
обусловленности у, могут отсутствовать слагаемые, соответст- 
вующие теоретически точным и при этом точно реализуемым 
при вводе в ЭВМ значениям коэффициентов многочлена. Это 
видно из оценки бу, где некоторые из А а, Могут быть тождест- 


венно равными нулю (т.е. соответствующие коэффициенты не 
считаются параметрами приближенного уравнения (1.16)). 


1.7. КОРРЕКТНЫЕ И НЕКОРРЕКТНЫЕ ЗАДАЧИ. 
ПОНЯТИЕ О МЕТОДАХ РЕГУЛЯРИЗАЦИИ 


В начале ХХ века при выяснении вопроса о соответствии 
математических и физических моделей задач естествознания 
впервые было введено понятие корректности математической за- 
дачи. В достаточно общем виде для операторного уравнения 


Ау=Х, (1.23) 


где А:У > Е — некоторый оператор, действующий из метриче- 
ского пространства У в метрическое пространство РЁ (обычно У 
и Е — полные метрические пространства, в частности, банахо- 
вы), корректность вводится следующим образом. 


Определение 1.1. Задача нахождения элемента 
УЕУТ ио заданному элементу ГЕ Е из уравнения (1.23) на- 
зывается корректно поставленной по Адамару”) для 
тройки (У, А, Е) или просто корректной, если: 

1) ири каждом РЕЁЕ существует решение уЕУ; 

2) это решение у единственно в У; 

3) решение непрерывно зависит от правой части 
уравнения (1.23) (т.е. из сходимости Г, > Г по метрике 
пространства Е следует сходимость у„ —> у по метрике 
пространства ТУ). 

При нарушении любого из этих трех условий задача 
(1.23) считается некорректной. 


*) Адамар Жак Саломон (1865—1963) — французский математик. 
Широко известен своими исследованиями по теории чисел, теории целых 
аналитических функций, теории дифференциальных уравнений, функцио- 
нальному анализу, механике. 
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Первые два условия корректности, фигурирующие в опре- 
делении 1.1, означают существование обратного оператора 


ИР ‚ третье условие — его непрерывность на всем про- 
странстве Г. 

Часто требование непрерывной зависимости решения от 
правой части уравнения (1.23) заменяют условием его устойчи- 
вости: 


У=>0 36=0(=): ре(Л, №)<д > ру(, у2) < Е, 
где /, /› — произвольные элементы АР, а у|, у› ЕУ — отве- 
чающие им решения (рр (-,-) и ру(,:) — метрики пространств ГР 
и У соответственно). 

Несколько более широкая трактовка третьего условия кор- 
ректности состоит в том, что в корректно поставленных задачах 
небольшие изменения в исходных данных (малые возмущения 
и Ав(1.23) ) вызывают небольшие изменения решения. 


До середины ХХ века математики не занимались теорией 
некорректных по Адамару задач, поскольку считалось, что эти 
задачи не имеют физического смысла. Однако содержательных 
некорректных задач, требующих математического обоснования и 
создания устойчивых методов их решения, в прикладных облас- 
тях накопилось значительное множество. В большинстве своем - 
это задачи, связанные с созданием систем автоматической мате- 
матической обработки результатов наблюдений и физических 
экспериментов. Таковыми являются задачи восстановления сиг- 
нала, обратные задачи теплопроводности, геофизики, астрофизи- 
ки и ряд других. С развитием науки и техники (в частности, циф- 
ровой) необходимость в умении решать некорректные задачи все 
возрастает. 

Рассмотрим простейший пример, демонстрирующий нару- 
шение тех или иных условий корректности и позволяющий по- 
нять, как можно избавиться от первых двух условий, т.е. сузить 
класс некорректных по Адамару задач. 

Запишем три двумерные системы линейных уравнений: 


Хх +2 = 1 
4 (система А); 

жа = 1 
м +2 = 1; 

(система Б); 
х1 +1.00001х5 = 1.000005 
м +2 = 0.5, 

(система В); 
м +х2 =1.5 
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Первая из них имеет решение, но не единственное: 


* Т 
х =(^1;1-х,) , где х| — свободная переменная. Здесь нару- 
шено второе условие корректности. В этом случае выход находят 
в том, что среди бесчисленного множества решений ищется ре- 


шение, ближайшее к заданной точке хо = (0 } хо ) ‚ называемой 


пробным решением. Такая точка может быть известна из каких- 
то априорных соображений (например, из физического смысла 


задачи); в противном случае полагают хо = 0. 


Итак, если требуется найти ближайшее к х 
системы А, нужно решить задачу минимизации 


ва. ($) 


Взяв метрику евклидова пространства К, имеем 


°=0 решение 


х? +(1-жм)? > шт <> 2х-2а-х)=0, 
откуда получаем х| = 0.5, 1-21 = 0.5, т.е. за решение системы А 
принимаем хи = (0.5; 0.5). 
Возвращаясь на время к общей задаче (1.23), дадим сле- 
дующее 


Определение 1.2. Решение уравнения (1.23), бли- 
экайшее к заданному пробному решению у, называется 
нормальным относительно У решением (или просто 
нормальным решением, если У =0). 


Другими словами, нормальное относительно У0 решение 


уравнения (1.23) — это проекция пробного решения У на мно- 
жество решений этого уравнения. Если указанное множество вы- 
пукло, то, как известно, такая проекция, а следовательно, и нор- 
мальное решение единственно. 

Обратимся теперь к системе Б. Легко убедиться, что реше- 
ние этой системы существует и единственно: хи = (0.5; 0.5)/. 


Произведем небольшие манипуляции с числами в этой системе. 
Если в ее правой части отбросить малое возмущение 
= = 0.000005 , то полученная в результате этого система 


м +х2 = 1, 
Хх +1.00001х> =] 
будет иметь решение (1; 0), значительно отличающееся от ре- 


шения (0.5; 0.5)7 системы Б. Отбросив малую добавку 0.00001 
в коэффициенте при хо, придем к системе 
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м +хХ2 =, 
х1+х =1.000005, 


вовсе не имеющей решений. Как видим, малые изменения в ис- 
ходных данных системы Б влекут не только большие количест- 
венные изменения решения, но и меняют ситуацию с его сущест- 
вованием и единственностью, т.е. имеет место нарушение третье- 
го требования в определении 1.1 корректности при выполненных 
первых двух для исходной задачи. Не вызывает сомнений факт, 
что для линейных алгебраических систем неустойчивость напря- 
мую связана с их плохой обусловленностью (убедитесь, что чис- 
ло обусловленности Тодда ($ 1.5) для матрицы системы Б при- 
ближенно равно 50000). 

Система В явно противоречива. Казалось бы, на этом сле- 
дует завершить разговор об этой системе: нет решения и нет. Од- 
нако, нередко случается, что несовместные системы отражают 
реальные ситуации, в которых решение в каком-то смысле долж- 
но быть. Встает вопрос о расширении понятия решения линейной 
системы. 

Еще в начале ХПХ века Гаусс и Лежандр*) независимо друг 
от друга предложили решать переопределенные, как правило, не- 
совместные системы методом наименьших квадратов (более под- 
робно об этом см. в $ 10.1). Суть их предложения состоит в том, 
что за решение таких систем вида Ау = принимается вектор у, 
минимизирующий функцию 


2 
Ф(у) =|Ау-й5 = (Ау-Р, Ау-Г). 
Эта функция всегда имеет неотрицательный минимум, который 


можно эффективно найти ввиду отсутствия локальных миниму- 
мов, отличных от глобального. 


Определение 1.3. Вектор у, на котором достигается 
ти Ф(у), называется псевдорешением системы Ау =Т. 


*) Гаусс Карл Фридрих (1777-1855) — известнейший немецкий ма- 
тематик. Его труды оказали глубокое влияние на развитие алгебры, теории 
чисел, дифференциальной геометрии, теории тяготения, геодезии, теории 
электричества и магнетизма, астрономии и др. 

Лежандр Адриен Мари (1752-1833) — французский математик. 
Известен своими работами по математическому анализу, вариационному 
исчислению, теории чисел. Обосновал и развил теорию геодезических из- 
мерений. 
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Из вида функции Ф(у) ясно, что если ттФ(у)=0, то 
у’=аго ттФ(у) есть точное решение системы Ау -=Ё, те. 
псевдорешение обобщает понятие решения в привычном пони- 
мании. 

Для нахождения псевдорешения системы Ау =Ё вместо 
решения экстремальной задачи Ф(у) > тт можно решать сим- 
метричную систему 

АГАу=АГЕ. (1.24) 
Действительно, так как 


Ф(у) = (Ау - Г, Ау-1) = (Ау, Ау) 2(Ау, Г) + (Е, Г) = 


= (АТ ду, у) 2(А71, у) (Е,1), 


то применяя необходимое (а в данном случае и достаточное) ус- 
ловие минимума и правила дифференцирования квадратичной и 
линейной форм, имеем 


Ф(у) =шш <> 2АГАу-2А(1=0, 


т.е. приходим к системе (1.24). 
Найдем псевдорешение системы В. Имеем: 


те} а 1) 2 
"=. 5) 


и, значит, система (1.24) в данном случае есть 
2х1 = 2х> = 2 
2х1 че 2х> = 


Последняя фактически совпадает с системой А, имеющей, как 
отмечалось выше, неединственное решение. Как получить ее 
единственное «решение», нам уже известно. 

Итак, введение понятия псевдорешения позволяет избавить- 
ся от несуществования, а понятия нормального решения — от 
неединственности. Объединяя их, приходим к тому, что если го- 
ворить о нахождении нормального псевдорешения (относитель- 
но задаваемого пробного решения), то первое и второе требова- 
ния корректности могут быть сняты (по крайней мере, сейчас мы 
можем утверждать это для алгебраических систем; для более об- 
щего случая здесь заложены лишь идейные основы). 

Резюмируя результат рассмотрения примера, можно ска- 


зать, что системы А и В имеют одно и то же нормальное относи- 


(1.25) 
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тельно вектора 0 = (0; 0)7 псевдорешение хи = (0.5; 0.5). Это 
решение, являясь точным решением системы Б, также служит и 
ее нормальным псевдорешением”. 

Теперь посмотрим, можно ли полученное нормальное псев- 
дорешение считать устойчивым. 


С этой целью сначала внесем возмущение # в один из ко- 
эффициентов системы А. Именно, наряду с системой А, имею- 


щей нормальное псевдорешение хи = (0.5; 0.5)7, будем рассмат- 
ривать систему 
| НЕ: = | 


1.26 
(1+ =)№1 + х2 =. ( ) 


1 
При любом ==0 определитель матрицы А; -[ этой 
+= 


системы равен —= (>20), и, следовательно, существует обрат- 
1 1 —1 
=\-(1+=) 1 
получить решение х, возмущенной системы (1.26): 


<=^ А) 


< * 
Найденное решение Х: оказалось независящим от возмущения # 
и, вследствие этого, неприближаемым к нормальному псевдоре- 
* т 
шению хо невозмущеннои системы А. 


Если такое же возмущение & внести в систему В, т. е. наря- 
дус ней исследовать систему 


ж +%2 = 0.5, 
(1+=)жм +х2 =1.5, 


ная к А; матрица А. =— ‚ через которую можно 


то здесь через ту же обратную матрицу д получаем решение 


ИЕ | —#\ (0,5 1 -—1 И= 

Хх. =—- =—— = ) 

Е 2 ТА =\1-0.5=) (\0.5-И= 
которое при = —>0 устремляется в бесконечность, а не к нор- 


мальному псевдорешению хи системы В. 


* > 

) К построению нормальных псевдорешений может быть примене- 
на другая техника, основанная на использовании так называемых псевдо- 
обратных матриц (Мура-Пенроуза) [43, 93]. 


ра 


И в том, и в другом случаях налицо неустойчивость нор- 
мального псевдорешения по отношению к возмущению матрицы 
системы (более обобщенно, к возмущению оператора). 

Проследим еще за реакцией системы В на возмущение ее 
правой части. При любом = *1 система 

м +^№ =0.5+=, 
(1.27) 
Хх я № = 145 
противоречива, как и исходная для нее система В. Поэтому вос- 
пользуемся ее преобразованием к виду (1.24), т. е. получим ана- 
лог системы (1.25). В данном случае имеем 


М1 [9+ г 9 2 Тв 
А=А! = Г, = ‚ АГА= ‚ АГ, = 
11 1.5 22 НЫЕ 


и, следовательно, нахождение псевдорешения системы (1.27) 
сводится к решению системы 


2м +2х5 =2+8, х+хо =1+0.5=, 
1 2 <> |" 2 


2х1 +2х2 =2+8, х| + хо =1+0.5&5. 


Решением последней служит множество векторов вида 


(%1;1+0.5=-х1)/, где х| — свободная переменная. Теперь ста- 
вим экстремальную задачу 


х +(1+0.5=-2х1)? > шт 


и из условия 2х1 -2(1+0.55-х) =0 находим значение 
х1 = 0.5 + 0.25= первой компоненты нормального псевдорешения; 
вторая его компонента есть 1+ 0.55 — 1 = 0.5 + 0.25=. Так как 


+ [о + — в + 
х; = ЕЕ =хХо, 
0.5+0.25=] =>0 \0.5 

то, по крайней мере, в этом частном случае можно говорить об 
устойчивости нормального псевдорешения по отношению к воз- 
мущению правой части. 

Осознание того факта, что несуществование и неединствен- 
ность решения уравнения (1.23) можно обойти путем обобщения 
(расширения) понятия решения и сужения множества, на кото- 


ром ищется это обобщенное решение, привело к новой формули- 
ровке корректности. 
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Определение 1.4. Задача о нахождении решения у 

уравнения (1.23) с непрерывным оператором А называется 
<. > * 

‘условно корректной или корректной по Тихонову”), если: 


1) априори известно, что решение у существует и 
принадлежит заданному множеству М СУ (множеству 
корректности, классу корректности); 

2) решение у единственно в М; 

3) бесконечно малым вариациям }, не выводящим за 
пределы М , соответствуют бесконечно малые вариации у. 


Выделение множеств корректности, как правило, эффек- 
тивно производится лишь в случаях привязки задачи (1.23) к 
конкретным приложениям, хотя, естественно, имеется ряд общих 
утверждений, обосновывающих такое выделение. Во многом 
благодаря трудам академика А.Н. Тихонова разработана общая 
стратегия построения устойчивых методов решения некоррект- 
ных (неустойчивых) задач в операторной форме. В ее основе ле- 
жит понятие регуляризирующего оператора или, что то же, регу- 
ляризирующего алгоритма. Дадим одно из возможных определе- 
ний [41]. 


Определение 1.5. Пусть Г — фиксированное точ- 
ное значение правой части уравнения (1.23), а }; — его 


приближенное значение такое, что рр (1, 5 6. 

Оператор К(Т,‚@) называется регуляризирующим 
оператором (регуляризирующим алгоритмом, регуляри- 
затором) для уравнения (1.23) в окрестности Х , если: 

1) оператор Е(Х,&) определен для любых р;ЕЁЕ, 
бЕ[0, 60| име [0, мц |, где бу и ву — некоторые предель- 
ные значения параметров 6 и“; 

2) существует такая зависимость @= (6), что 


У=>0 36(=)>0: РЕ(Ё, Х)<6 <6(=) > ру,,У<{]|, 
где У» := В(7 5, @(6)) — регуляризованное решение уравне- 
ния (1.23), а элемент У таков, что Ау= Е. при этом 
должно быть 


0—0 = а->0, =#->0 


* ; 

) Тихонов Андрей Николаевич (1906—1993) — российский матема- 
тик и геофизик. Наряду со многими другими своими научными достиже- 
ниями положил начало бурному развитию теории и практики методов ре- 
шения некорректных задач (1943 г.). Термин «корректность по Тихонову» 
принадлежит другому крупному специалисту по некорректным задачам — 
академику РАН Лаврентьеву Михаилу Михайловичу (род. 1932г.). Вооб- 
ще, следует отметить ведущие позиции российских ученых в данной про- 
блематике. 
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(т.е. при д —>0 регуляризованное решение У», должно 
стремиться к точному решению У). 


Заметим, что, во-первых, ниоткуда не следует единствен- 
ность регуляризатора для данной задачи, а во-вторых, требова- 
ние у, >> У при 6 -—>0 имеет только теоретическое значение, 
поскольку уровень б погрешностей исходных данных не может 
быть уменьшен по желанию вычислителя. 

Всякая задача вида (1.23), для которой существует регуля- 
ризирующий оператор, называется регуляризуемой (или регуля- 
ризируемой), а всякий метод, порождающий такой оператор, на- 
зывается методом регуляризации. Фигурирующая в определе- 
нии 1.5 скалярная величина & = (6) называется параметром 
регуляризации. 

Одним из наиболее универсальных способов построения ре- 
гуляризирующих алгоритмов является метод @а-регуляриза- 
ции Тихонова. Суть его в следующем. 

Пусть в уравнении (1.23) А — линейный вполне непрерыв- 
ный оператор (т.е. любое ограниченное множество из У перево- 
дится им в компактное множество из Г), У и Е — гильбертовы 
пространства, и пусть вместо «точного» уравнения (1.23) извест- 
но «приближенное» уравнение 


Яу=Х, (1.28) 
где уЕХ, ГЕК, а близость (1.23) и (1.28) характеризуется не- 
равенствами 


[“-4]|=«, |7-/|=5. (1.29) 
При поиске решения уравнения (1.23) на базе уравнения (1.28) 
вместо минимизации невязки [Ау -л | которая, как отмечалось в 


$ 1.5, на неустойчивых задачах может вести себя нерегулярно, 
предлагается минимизировать так называемый сглаживающий 
функционал (функционал Тихонова) 


= 22 

Фа, 4, 7|=|№-7|[ +а9[. 
Здесь &«>0 — параметр регуляризации, а О[у|] — стаби- 
лизирующий функционал (стабилизатор), главное требование 


2 
к нему — неотрицательность; чаще всего, берут О[у]:= ||. 
Доказано, что функционал Тихонова, в частности, 


Фи, 1, 1 =|№- 7 +? (1.30) 


всегда имеет и притом единственный элемент Ус такой, что 


Фи [р А, П- шеф. А, в 
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При всяком фиксированном & > 0 последнюю задачу мож- 
но решать как подходящими численными методами минимиза- 
ции, так и с помощью решения уравнения Тихонова 


ау. +А*Ау, =А*}, (1.31) 
которое представляет собой запись необходимого условия 
экстремума Ф„ [у, А, 7] (А* — оператор, сопряженный опера- 
тору А). 

Так как реально д “> 0, &>^> 0, то параметр регуляриза- 
ции @ должен подбираться так, чтобы принимаемое за решение 
задачи (1.23) регуляризованное решение у, было, по возможно- 


сти, наилучшим в смысле удачного согласования левой и правой 
частей уравнения (1.28) (что определяется малостью невязки 


и 29 . 
| -7 ) и устойчивости его вычисления (что связано с вели- 


чиной стабилизатора |у„|”). При этом, чем меньше 6 и &, тем 


меньшим должно быть значение сх, т.е. большим относительный 
вес первого слагаемого в функционале Тихонова. Таким образом, 
в методе а«-регуляризации Тихонова (впрочем, как и в других 
методах регуляризации) главной проблемой является проблема 
выбора параметра регуляризации, призванного сбалансировать 
возможность получения регуляризованного решения у„, как 


можно более близкого (в условиях оговоренной неопределенно- 
сти) к решению именно «нужной» задачи, с тем, чтобы оно могло 
быть надежно вычислено. Имеется несколько способов выбора 
параметра регуляризации [34, 41, 128 и др.]. 

Для интерпретации процедуры а-регуляризации вновь об- 
ратимся к рассматривавшимся в начале параграфа системам ли- 
нейных алгебраических уравнений. 

Можно считать, например, что система А служит приближен- 
ной для системы Б. Тогда в обозначениях (1.23), (1.28) имеем: 


1 1 = 111 1 = [1 
А - . А = Г Г = я Г = р 
} ри | у й и |, 


При этом сама система Б, вообще говоря, предполагается неиз- 
вестной; известно лишь, насколько она близка к системе А. 


Положив у = (1; хо)", находим | =? +2, 
о а И = 342 2 
Ау-Т= А-Я =201 + 12. 
[|| Ю-В и +-0 
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Следовательно, функционал Тихонова (1.30) в данном случае 
есть 


Фа[у, 4, 1|=2041 +х2 -12 +а(х? +х2), 
а а-регуляризованное по Тихонову решение — 
Ус = ре = аготш [26 + —1)? +2? +55) . 
х2(@) т 
(м;%) ЕВ, 


Так как здесь А" =АТ = А, то уравнение Тихонова (1.31) при- 


нимает вид 
Пе вдзывай  1 
а > = 
х2(9)) 2 2Лх() 1 11 


или после упрощения 


№. 2 НЫ 
2 2+аЛж(@)] Л 
Отсюда легко получаем параметризованное решение 


_ (ха) _ д () 
У (== |} (1.32) 


при а-> 0 стремящееся к нормальному псевдорешению 


(0.5; 0.5). Однако устремлять &@ к нулю как раз и не следует, а 
нужно каким-то образом зафиксировать его так, чтобы оно отра- 
жало связь систем А и Б, характеризуемую степенью близости А 
кА, Г кг. Как уже отмечалось, нахождение оптимальных зна- 
чений параметра © в общем случае представляет собой сложную 
задачу. Но для линейных алгебраических систем имеются про- 
стые прикидки для значений параметра & и точности приближе- 
ния нормального псевдорешения у( регуляризованным решени- 
ем ух, при таких @. Например, считается [33], что если в оценках 
(1.29) близости систем (1.23) и (1.28) &=д=&, то регуляризиро- 
ванное решение у„, системы (1.28) приближает нормальное псев- 


2 


2 
дорешение системы (1.23) с точностью с(= ) при & = #3, если 


в 6 
эта система разрешима, и с точностью {=} при а = =? , если 
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она неразрешима. Если в рассматриваемом примере несколько 
завысить д и посчитать, что & =д = 0.00001, то, согласно приве- 


10 
денной рекомендации, можно взять 4 =10 $ = 0.000464 и, 


подставив это значение в формулу (1.32), получить регуляризо- 
го 


0.499942 


В заключение параграфа отметим, что информацию о мето- 
дах решения некорректных задач (в настоящее время все чаще 
говорят — неустойчивых) можно найти и в научно-популярной 
[33, 93], и в учебной [78, 148, 174, 181, 194], и, естественно, в 
специальной литературе [11, 28, 34, 41, 128, 175 и др.]. С некор- 
ректными задачами в этой книге мы еще встретимся далее, на- 
пример, в главах 13 и 18. 


ванное решение Ув я 


УПРАЖНЕНИЯ 
1.1. Найдите приближенное значение выражения 
3.7894-0.29? 
5.63 ' 


считая, что входящие в него числа (за исключением показателя степени) 
—= приближенные, записанные в соответствии с правилом Крылова. 

Сделайте теоретическую оценку главной части абсолютной погреш- 
ности результата. 


1.2. Пусть машинное слово некой ЭВМ состоит из 16 четверичных 
разрядов. 

а) Найдите приближенно значения машинного нуля Мо, машинной 
бесконечности М и машинного эпсилон в системе представления с пла- 
вающей запятой, предполагая, что под мантиссу выделяется 11 разрядов. 

6) Оцените абсолютную погрешность и диапазон представимости 
чисел с фиксированной запятой при условии, что под целую и дробную 
части числа выделяется поровну разрядов. 

(Считается, что для отображения знаков «+», «—», и «,» используют- 
ся те же четверичные элементы и что округление производится на основе 
простого отбрасывания). 


1.3. Обращением матрицы коэффициентов решите систему 
Хх —= Хз = 7 у 
м + х2 +ж =6, 
х2 + Зхз =; 
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Найдя число обусловленности, оцените возможные относительное и абсо- 
лютное отклонения от полученного решения при относительной ошибке в 
правой части порядка 0.01 (по некоторой норме). 


1.4. Докажите справедливость неравенств (1.14). Примените одно из 
этих неравенств к системе упр.1.3, считая, что в ее матрицу А внесено 
возмущение ДА такое, что |ЛА]|| = 0.01. 


1.5. Пусть коэффициенты уравнения 


2 
х` —6.9х- 0.0212=0 
являются приближенными числами, записанными в соответствии с прин- 


ципом Крылова (коэффициент при х? и правую часть считаем числами 
точными). 

а) Найдите корни уравнения с максимальной разумной точностью, 
диктуемой степенью неопределенности коэффициентов. 

6) Подсчитайте числа обусловленности для найденных корней и на 
этой основе дайте приближенную оценку их относительных и абсолютных 
погрешностей. 


1.6. Найдите множество решений и нормальное (относительно нуле- 
вого вектора) решение системы 


2х1 = Зхо + = 3. 
м+ + ж= 6, 
3х + 5х2 а Хз = 20. 


1.7. Убедитесь в плохой обусловленности систем: 


) 2х —5х5 =1, 
а 
2х1 - 4.9999х. =1; 
6) 2х1 — 5х2 =1, 
2х1 - 4.9999х. =1.0003; 


) 2х — 5х2 1% 
В 
2х1 — 5х2 =1.0003. 


Найдите их нормальные псевдорешения. Принимая за основу систему 


2жм —5х2 =1, 
2х1 — 5х2 =]. 


получите а -регуляризованные решения систем а- в. 
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ГЛАВА 2 ||РЕШЕНИЕ ЛИНЕЙНЫХ 
АЛГЕБРАИЧЕСКИХ СИСТЕМ 
(ПРЯМЫЕ МЕТОДЫ) 


Рассматриваются простые, часто применяемые числен- 
ные методы решения систем линейных алгебраических уравне- 
ний с квадратными матрицами коэффициентов. Попутно ре- 
шаются задачи обращения матриц и вычисления определителей. 
Наряду с широко известным методом Гаусса, изучаемым здесь в 
плане реальных вычислений, вниманию читателя предлагаются 
также метод вращений (более устойчивый к погрешностям 
арифметических действий, чем метод Гаусса), метод квадрат- 
ных корней для решения систем с симметричными матрицами и 
метод прогонки для систем с трехдиагональными матрицами 
(т.е. для трехточечных разностных уравнений второго порядка). 


2.0. ВВЕДЕНИЕ 


Как утверждается в книге известного американского мате- 
матика Валяха [29], 75% всех расчетных математических задач 
приходится на решение систем линейных алгебраических урав- 
нений (в дальнейшем, СЛАУ). Это не удивительно, так как мате- 
матические модели тех или иных явлений или процессов либо 
сразу строятся как линейные алгебраические, либо сводятся к та- 
ковым посредством дискретизации и/или линеаризации. Поэтому 
трудно переоценить роль, которую играет выбор эффективного 
(в том или ином смысле) способа решения СЛАУ. Современная 
вычислительная математика располагает большим арсеналом ме- 
тодов, а математическое обеспечение ЭВМ — многими пакетами 
прикладных программ, позволяющих решать различные возни- 
кающие на практике линейные системы. Чтобы ориентироваться 
среди методов и программ и в нужный момент сделать опти- 
мальный выбор, нужно разбираться в основах построений мето- 
дов и алгоритмов, учитывающих специфику постановок задач, 
знать их сильные и слабые стороны и границы применимости. 

Все методы решения линейных алгебраических задач (наря- 
ду с задачей решения СЛАУ, это и вычисление определителей, и 
обращение матриц, и задачи на собственные значения) можно 
разбить на два класса: прямые и итерационные. Как явствует из 
заглавия, здесь будут рассмотрены только прямые методы, т.е. 
такие методы, которые приводят к решению за конечное число 
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арифметических операций. Если операции реализуются точно, то 
и решение также будет точным (в связи с чем к классу прямых 
методов применяют еще название иючные методы). Итераци- 
онным методам, т.е. методам, в которых точное решение может 
быть получено лишь в результате бесконечного повторения еди- 
нообразных (как правило, простых) действий, будет посвящена 
следующая глава. 

Другое ограничение будет касаться рассматриваемых сис- 
тем. Условимся говорить о численном решении таких СЛАУ, у 
которых число уравнений совпадает с числом вещественных не- 
известных, причем будем предполагать наличие единственного 


решения”), если существование и единственность не следует из 
каких-либо условий. 

Такое ограничение здесь довольно естественно, так как ре- 
шение и недоопределенных, и переопределенных систем, а также 
систем с комплексными коэффициентами и переменными, в ко- 
нечном счете, сводится к решению однозначно определенных 
вещественных систем. 

Итак, изучается вопрос о численном решении систем вида 


ах +а]2х2 +йЙ +а]ихи = Ы, 

аэ1х1 + а22х5 +Й +а2,х, = В, 
2171 лит 2п^п 2 (2.1) 

ам +ан2х2 +й +аихи = В 

или иначе, векторно-матричных уравнений 

Ах=Ь, (2.1а) 
где Ь=(Ы,Б>,й ‚5, — вектор свободных членов и 
Е, )` — вектор неизвестных (он же в другой ин- 


терпретации может означать и вектор-решение) с вещественны- 
ми координатами, а А= (а; вы — вещественная ихи-матрица 
‚ = 


коэффициентов данной системы. Эффективность способов реше- 
ния системы (2.1) во многом зависит от структуры и свойств 
матрицы А: размера, обусловленности (см. 51.5), симметрично- 


* 
) Обратим внимание на двоякое употребление в тексте термина 
«решение»: 
Г) решение — как упорядоченный набор (вектор) значений неиз- 
вестных, удовлетворяющих всем уравнениям системы; 
2) решение — как процесс нахождения решения в первом смысле. 
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сти, заполненности (т.е. соотношения между числом ненулевых и 
нулевых элементов), специфики расположения ненулевых эле- 
ментов в матрице и др. 

Так, размерность системы (т.е. число и) является главным 
фактором, заставляющим вычислителей отвернуться от весьма 
привлекательных в теоретическом плане и приемлемых на прак- 
тике при небольших и (2, 3) формул Крамера 


Р _ Че А; 
' а&дА 


позволяющих находить неизвестные компоненты векторах в 
виде дробей, знаменателем которых является определитель мат- 
рицы системы, а числителем — определители матриц А;, полу- 
ченные из А заменой столбца коэффициентов при вычисляемом 
неизвестном столбцом свободных членов. Если при реализации 
этих формул определители вычисляются понижением порядка на 
основе разложения по элементам какой-нибудь строки или 
столбца матрицы, то на вычисление определителя и-го порядка 
будет затрачиваться и! операций умножения. Факториальный 
рост количества арифметических операций (и вообще, очень бы- 
стрый рост) с увеличением размерности задачи называют «про- 
клятьем размерности». Что это такое, можно представить, зафик- 


сировав, например, ип=100. Оценив величину 100! = 10158 и 
прикинув потенциальные возможности развития вычислительной 
техники, приходим к выводу о том, что в обозримом будущем 
системы сотого порядка в принципе не могут быть решены по 
формулам Крамера [12, 92]. Заметим при этом, что, во-первых, 
метод Крамера будет неустойчив, т.е. погрешности округлений 
будут катастрофически нарастать, во-вторых, размерность 
п=100 для современных задач не так и велика: довольно часто 
решаются системы с сотнями и с тысячами неизвестных. 

Если осуществлять вычисление обратной матрицы с помо- 
щью союзной матрицы, т. е. через алгебраические дополнения, то 
нахождение решения векторно-матричного уравнения (2.1а) по 


формуле 


(1=1,2,й ‚п), 


Х=А 


фактически равнозначно применению формул Крамера и также 
практически непригодно по упомянутым выше причинам для вы- 
числительных целей. 
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2.1. АЛГОРИТМ РЕШЕНИЯ СЛАУ 
МЕТОДОМ ГАУССА С ПОСТОЛБЦОВЫМ 
ВЫБОРОМ ГЛАВНОГО ЭЛЕМЕНТА 


Наиболее известным и популярным способом решения ли- 
нейных систем вида (2.1) является метод Гаусса. Суть его про- 
ста — это последовательное исключение неизвестных. В отличие 
от курсов линейной алгебры, нас будут интересовать вычисли- 
тельные аспекты метода Гаусса, а именно, технология получения 
вектора-решения х из исходных матрицы А и вектора Ъ, при- 
чем, по возможности, минимизирующая влияние неизбежных 
ошибок округлений. С этой целью, работая с уравнениями сис- 
темы (2.1), выведем сначала совокупность формул, позволяющих 
в итоге получить искомые значения неизвестных, а затем на их 
основе запишем алгоритм решения поставленной задачи. 

Будем поэтапно приводить систему (2.1) к треугольному 
виду, исключая последовательно сначала х| из второго, третьего, 


., п-го уравнений, затем хо из третьего, четвертого, ... ‚ и-го 
уравнений преобразованной системы, и т.д. 

На первом этапе заменим второе, третье, ..., п-е уравнения 
на уравнения, получающиеся сложением этих уравнений с пер- 
вым, умноженным соответственно на “21, _Яз1, й _“т ре- 

Ч 1 Ч 1 11 


зультатом этого этапа преобразований будет эквивалентная (2.1) 
система 


Гах + а12х› +а]зхз +й +аихи = Ь й 
ах +а9 хз +Й ча х„ = ь®, 
ах. @, +Й а, = О, (2.2) 
ах. ча хз +й ча х, = Ь®, 


коэффициенты которой (с верхним индексом 1) подсчитываются 
по формулам 


а =а, И ; БО =Ь,-“ИЬ , где 1/1 =2,3,й ‚и 

ы ыы 

При этом можно считать, что а1| = 0, так как по предположению 
система (2.1) однозначно разрешима, значит, все коэффициенты 
при х| не могут одновременно равняться нулю, и на первое ме- 


сто всегда можно поставить уравнение с отличным от нуля пер- 
вым коэффициентом. 
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На втором этапе проделываем такие же операции, как и на 
первом, с подсистемой системы (2.2), получающейся исключени- 
ем первого уравнения. Эквивалентный (2.2) (а значит, и (2.1)) ре- 
зультат второго этапа будет иметь вид 


@1 1х1 + а12^2 + а]3 Хз +й +аих, = Ь ы 
ах +а хз +й на =Б 
Оч ча@х, = 50) 


033 я 
ах +1 +а@)х, — 2), 


(1) (1) 
М. М ОО 92. ва. 
где ар; =а;, 92’ р =Ь; (2 › ДЕЗ В.И: 
922 ..- 
Продолжая этот процесс, на (и-_1)-м этапе так называемого 
прямого хода метода Гаусса данную систему (2.1) приведем к 
треугольному виду: 


а 1х1 + а12^2 +й +а]ихи = Ы, 


ада +й ах, = 5), (2.3) 
0х, — ы"О. 


На основе предыдущих рассуждений и формул легко убедиться, 
что коэффициенты этой системы могут быть получены из коэф- 
фициентов данной системы последовательным пересчетом по 


формулам 


а(® а _ а к (0 р) — „р -9 _ а” (к-1) 
А Паул, мы а сео © 
Ч 


где верхний индекс К (номер этапа) должен изменяться от 1 
до и-1, нижние индексы Ги / (в любой очередности) — от К+1 


до и; по определению полагаем а® = =а; у, ь0) =Ь 


Треугольная, точнее, трапециевидная структура системы 
(2.3) позволяет последовательно одно за другим вычислять зна- 
чения неизвестных, начиная с последнего: 
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см 
1 1 1 
ы _ 50 -аФх—й ах 
27 (0) : 
9>> 
-врхь-Й = 
ж =21 Бары, ЧиХи 


ен 
Этот процесс последовательного вычисления значений неизвест- 
ных называют обратным ходом метода Гаусса. Очевидно, он 
определяется одной формулой 
о 
— (и 
Ч 


Е п. ей 
вх шум | (2.5) 
1=+1 


к 


где К полагают равным и, и-—1й ‚2,1 и сумма по определению 
считается равной нулю, если нижний предел суммирования у 
знака » имеет значение больше верхнего. 

Итак, решение СЛАУ вида (2.1) методом Гаусса сводится к 
последовательной реализации вычислений по формулам (2.4) 
и (2.5). 

Учитывая цикличность выполняемых при этом операций, а 
также нецелесообразность хранения промежуточных результатов 
(пересчитываемых коэффициентов промежуточного этапа), за- 
пишем простой алгоритм решения линейных систем (2.1) ме- 
тодом Гаусса [138]: 

1. для =, 2, й ‚п-1, 

2. длят=ЕК+ЬЙ и: 

3. Нк =а к Гацщ, 

4. Ь; =Ь; —Вабь; 

5. длЯ] ЕЁК+ЬЙ, И: 

а; } =а как у. 
7. хи =В,/ал; 
8. дляк= п-ЬЙй , 2,1: 


2 


1] 
9. хк = Ь. -— раку Гар. 
= 
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Подав на его вход квадратную матрицу (а, ;} р коэффи- 


циентов при неизвестных системы (2.1) и вектор (6; свобод- 
ных членов и выполнив три вложенных цикла вычислений пря- 
мого хода (строки 1—6) и один цикл вычислений обратного хода 
(строки 7-9), на выходе алгоритма получим вектор-решение 


(хх У (в обратном порядке), если, разумеется, ни один из знамена- 
телей не обращается в нуль и все вычисления проводятся точно. 

Так как реальные машинные вычисления производятся не с 
точными, а с усеченными числами, т.е. неизбежны ошибки ок- 
ругления, то анализируя, например, формулы (2.4), можно сде- 
лать вывод о том, что выполнение алгоритма может прекратиться 
или привести к неверным результатам, если знаменатели дробей 
на каком-то этапе окажутся равными нулю или очень маленьки- 
ми числами. Чтобы уменьшить влияние ошибок округлений и ис- 
ключить деление на нуль, на каждом этапе прямого хода уравне- 
ния системы (точнее, обрабатываемой подсистемы) обычно 
переставляют так, чтобы деление производилось на наибольший 
по модулю в данном столбце (обрабатываемом подстолбце) эле- 
мент. Числа, на которые производится деление в методе Гаусса, 
называются ведущими или главными элементами. Отсюда на- 
звание рассматриваемой модификации метода, исключающей де- 
ление на нуль и уменьшающей вычислительные погрешности, — 
метод Гаусса с постолбиовым выбором главного элемента 
(или, иначе, с частичным упорядочиванием по столбиам). 

Частичное упорядочивание по столбцам требует внесения в 
алгоритм следующих изменений: между строками 1 и 2 нужно 


сделать вставку) 
«Найти т > К такое, что |атх |= тах{|а; |}; 
1>А 


если атх =0, остановить работу алгоритма («однозначно- 
® |го решения нет»), 
иначе поменять местами Бу и Би, арги ат, при 


всех /=КА,Й ‚ и.» 


Более разумным, наверное, является сравнение [аих| не с 


нулем, а с некоторым малым &> 0, задаваемым вычислителем в 
зависимости от различных априорных соображений. Счет оста- 


*) Чтобы частичное упорядочивание было более эффективным, пе- 
ред этим целесообразно произвести масштабирование (уравновешива- 
ние) системы, например, разделить все числа каждой строки на наиболь- 
шее число строки [138]. 
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навливается или берется под особый контроль, если окажется 
@пк|<=. Заметим, что соответствующая частичному упорядо- 


чиванию вставка © в алгоритм позволяет фактически в процессе 
его выполнения проводить алгоритмическое исследование сис- 
темы (2.1) на однозначную разрешимость. 

Устойчивость алгоритма к погрешностям исходных данных 
и результатов промежуточных вычислений можно еще усилить, 
если выполнять деление на каждом этапе на элемент, наиболь- 
ший по модулю во всей матрице преобразуемой на данном 
этапе подсистемы. Такая модификация метода Гаусса, называе- 
мая методом главных элементов, применяется довольно редко, 
поскольку сильно усложняет алгоритм. Усложнение связано как 
с необходимостью осуществления двумерного поиска главных 
элементов, так и с необходимостью запоминать номера столбцов, 
откуда берутся эти элементы (перестановка столбцов означает 
как бы переобозначение неизвестных, в связи с чем требуется 
обратная замена). 


2.2. ПРИМЕНЕНИЕ МЕТОДА ГАУССА _ 
К ВЫЧИСЛЕНИЮ ОПРЕДЕЛИТЕЛЕИ И 
К ОБРАЩЕНИЮ МАТРИЦ 


Как было сказано в $ 2.0, решения линейных алгебраиче- 
ских систем можно получать с помощью определителей или об- 
ратных матриц. Однако нетрудно увидеть, что более эффективно 
поступать наоборот: вычислять определители и обращать матри- 
цы в рамках метода Гаусса решения линейных систем. 

Действительно, выполняемые в методе Гаусса преобразова- 
ния прямого хода, приведшие матрицу А системы к треугольно- 
му виду (см. (2.3)) таковы, что они не изменяют определителя 
матрицы А. Учитывая, что определитель треугольной матрицы 
равен произведению диагональных элементов, имеем 


ат а2 й ай 
Я = 
4ег А = 22 2п =а -а0).й ‚а © . 


0 0 Р 2070 


Таким образом, определитель матрицы равен произведению всех 
ведущих элементов при ее преобразовании методом Гаусса. 

При желании получить 4её А дополнительно к решению 
СЛАУ Ах=Ь алгоритм предыдущего пункта должен быть 
пополнен всего лишь одной следующей строкой: 
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п 
10. д4елд= Пак . 
=] 


Если метод Гаусса используется только для вычисления 
определителя, из алгоритма его реализации следует изъять стро- 
ки4и 7-9. 

Так как перестановка строк матрицы меняет знак определи- 
теля, то при постолбцовом выборе главного элемента, т. е. при 
включении в алгоритм вставки ®, нужно в результате учесть 
число р произведенных перестановок, точнее, четность этого 
числа. Это означает, что при вычислении 4еЁ А алгоритмом Га- 
усса с частичным упорядочиванием вместо строки 10 должна 
быть включена строка 


10. че А=(-ПР Пай. 


= 
2-11 
Пример 2.1. Дана матрица А =| 4 3 1. Методом Гаусса 
б —=3 6 


найти де А. 


Для данного случая алгоритм предыдущего параграфа может быть 
конкретизирован так: 


1. для =1,2, 

2. для1=К+Ь3: 
ый: 

3. т Ва 


4. для = +1,3: 
5 ау = ау —как; 
6. Ч&А:=а| -а2 аз. 
Воспользуемся им. Фиксируем А=1 и, соответственно, 1=2. Тогда 
921 _ 4 р 
= ===2, ипри =2,3 имеем 
21 аа 2 ри / 
@22 = а22 — 121412 =3-2(-Ю=5, 
@23 = 423 — аз =1-2.1=-1. 


а 

Переключая 7 на значение 3, далее подсчитываем (31 = =0 = 3 и при 
Я 1 

7=2,3 получаем 


32 = а32 —#31а12 =-13- 3(-10 =-10, 
азз = азз — (31а1з =6-3.1=3. 
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Теперь полагаем А =2 (т.е. переходим ко второму этапу преобразований). 
При этом значении А индексы Ги / могут принять только одно значе- 


ние 3. Следовательно, достаточно подсчитать 


а =: 
132 === И @33 = азз - (32423 =3-(-2)(-0=1 
@22 


(где вместо элементов 422, 423, @з2, азз исходной матрицы подставля- 
ются новые, подсчитанные на первом этапе, значения), чтобы получить 
искомое значение определителя 


4е А =2.5.1=10. 


Для получения матрицы А, обратной к матрице 
А = (а, РА НР будем исходить из того, что она является решени- 
ем матричного уравнения 
АХ =Е, (2.6) 
где Е — единичная матрица. 


и 


Представляя искомую матрицу х=(, ‚) ‚| Как набор (век- 


1, ]= 
тор-строку) векторов-столбцов 
хи Х12 Ми 
Х21 _| 22 _| ^2и 
Х1 = Е Й Х2 - ее , й ) Хи т т , 
Хт Хи2 Хип 


аединичную матрицу Е как набор единичных векторов 


1 0 0 

0 | 0 
=} ма и 2 й "= 

0 0 1 


матричное уравнение (2.6) в соответствии с правилами умноже- 
ния матриц подменим эквивалентной системой не связанных ме- 
жду собой векторно-матричных уравнений 


Ах, =е1; Ах› =е›; й ; Ах =е,. (2.7) 


Каждое из последних уравнений имеет вид (2.1а) и может быть 
решено методом Гаусса. При этом специфичным является то об- 
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стоятельство, что все СЛАУ (2.7) имеют одну и ту же матрицу 
коэффициентов, а это означает, что наиболее трудоемкая часть 
метода Гаусса — приведение матрицы системы к треугольному 
виду — общая для всех систем (2.7). Так что, если требуется при- 
способить рассмотренный выше алгоритм решения СЛАУ мето- 
дом Гаусса к обращению матриц, целесообразно не просто при- 
менить его последовательно и раз к системам (2.7), а слегка 
подкорректировать: «размножить» строки 4 и 9 так, чтобы в роли 
вектора Ь оказались все единичные векторы е|,е›,й ‚е„. Тогда 
в результате завершения работы алгоритма будут получаться 
столбец за столбцом (столбцы «перевернуты»!) элементы обрат- 


ной матрицы Х = д ®. При этом введение в алгоритм частичного 
упорядочивания, т.е. постолбцовый выбор главного элемента, не 
требует запоминаний и обратных замен. 


2.3. ГО-РАЗЛОЖЕНИЕ МАТРИЦ 


1 


Пусть А= (а, ,} 1 — данная ихи-матрица, а .=(,,) Е 


и О = (и в _| — соответственно нижняя (левая) и верхняя (пра- 
ь = 
* 
вая) треугольные матрицы ). Справедливо следующее утвержде- 
ние. 


Теорема 2.1 [42, 158, 183]. Если все главные миноры 
квадратной матрицы А отличны от нуля, то существуют 
такие нижняя 1 и верхняя Ч треугольные матрицы, что 
А =ГО. Если элементы диагонали одной из матриц 1 или 
0 фиксированы (ненулевые), то такое разложение едиист- 
венно. 


Вместо полного доказательства этой теоремы (см., напри- 
мер, [42]) получим формулы для фактического разложения мат- 
риц в случае фиксирования диагонали нижней треугольной мат- 
рицы №. 


* 

) Общепринятые обозначения 1, и \ связаны с английскими слова- 
ми /омег (нижний) и иррег (верхний). Существует другой стандарт обо- 
значения: Ш и В, определяемый словами [ей (левый) и 712й1 (правый). 
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Будем находить 1} (при 7>/) и и;; (при 7< 7) такие, 


чтобы 
1 0 й 0 И11 И]|2 й И] и 
51 1 й 0 0 И й И2 и 


ан 42 й ая 


а21 922 й @2п 


1 2 й 1 0 ол Итп Чит Чи2 й ЯЧйп 


Выполнив перемножение матриц, на основе поэлементного при- 
равнивания левых и правых частей приходим к ихи-матрице 
уравнений 


и 1 =а1, и 2 =а2, й , ии =а, 
Бит = а, Био +22 =а22, Й , Ри +2 = ар, 
1 =ащ, 42 +2122 =а2, Йй , ия +--+иИи =аи 

относительно их и-матрицы неизвестных 
#11, 112, Й , И, 
[51» Ио, Й › Ин, 3) 
И 2, й ‚› Ип: 


Специфика этой системы позволяет находить неизвестные (2.8) 
одно за другим в следующем порядке. 
Из первой строки уравнений имеем 


и =а1 у (7=ЪЙ ‚п); 
из оставшейся части первого столбца уравнений 
ай 
п=— =: Й ‚в 
и 1 


из оставшейся части второй строки 
и =а Бу (У=2,й ‚п); 
из оставшейся части второго столбца 
а:2 -1и12 
= (1=З,Й ‚п) 
из 
И Т.Д. Последним находится элемент 


п—1 
И ти Чип - БЕНЕЯ . 
К= 
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Легко видеть, что все отличные от 0 и 1 элементы матриц 1, 
и 0 могут быть однозначно вычислены с помощью всего двух 


формул: 
1-1 
К=1 


о а 
1} — а НЕЕ (где 1> 7). (2.10) 
ых = 

При практическом выполнении разложения”) матрицы А 
нужно иметь в виду следующие два обстоятельства. 

Во-первых, организация вычислений по формулам 
(2.9)—(2.10) должна предусматривать переключение счета с одной 
формулы на другую в соответствии с показанным выше процес- 
сом получения неизвестных, приведшим к этим формулам. Это 
удобно делать, ориентируясь на матрицу неизвестных (2.8) (ее, 


кстати, можно интерпретировать как и“-мерный массив для ком- 
пактного хранения ГО-разложения в памяти компьютера), а 
именно, первая строка (2.8) вычисляется по формуле (2.9) при 
1= ]=12,й ‚п; первый столбец (2.8) (без первого элемента) 
— по формуле (2.10) при л=Ъ 1=2,й ‚и, ит.д. 

Во-вторых, препятствием для осуществимости описанного 
процесса [.О-разложения матрицы А может оказаться равенство 
нулю диагональных элементов матрицы Ч, поскольку на них 
выполняется деление в формуле (2.10). Отсюда требование тео- 
ремы, накладываемое на главные миноры (напомним, что глав- 


ными минорами матрицы А=(а "| называются определите- 


ли подматриц Ах := (@,)} НИ где К=1,2,й ‚и-1). Заметим, что 
и11 = а11, Т.е. первый диагональный элемент матрицы © совпада- 
ет с первым главным минором А и по условию должен быть от- 
личным от нуля. Второй диагональный элемент матрицы 9 


1 Ч] 


РВ — 921 Я21 922 
и22 =а22 11 = 20 тар === 
Ч 1 Ч 1 


не равен нулю, если отличен от нуля второй главный минор, и 
т.д. Ясно, что вместо проверки на равенство нулю главных мино- 
ров данной матрицы удобнее делать такую проверку для элемен- 


* 
) Применяют также термины факторизация, декомпозиция. 
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тов и’) в процессе их вычисления, причем, чтобы уменьшить 


влияние погрешностей округлений, лучше сравнивать модули 
и ; ; © малой положительной константой (допуском). Для опреде- 


ленных классов матриц требования теоремы о разложении заве- 
домо выполняются. Это относится, например, к матрицам с 
диагональным преобладанием, т.е. к таким, для которых 


[а;|> Зе \У1={1,2,й ‚т}. 
= 


(021) 


2.4. РЕШЕНИЕ ЛИНЕЙНЫХ СИСТЕМ И 
ОБРАЩЕНИЕ МАТРИЦ С ПОМОЩЬЮ 
Д-РАЗЛОЖЕНИЯ 


Если матрица А исходной системы (2.1) разложена в про- 
изведение треугольных Г, и \, то, значит, вместо (2.1а) можно 
записать эквивалентное (2.1) уравнение 


ГОх=Ь. 


Введя вектор вспомогательных переменных у = (1, у>,Й ‚у„ т. 
последнее можно переписать в виде системы 

Гу =Ь, 

Ох=у. 
Таким образом, решение данной системы с квадратной матрицей 
коэффициентов свелось к последовательному решению двух сис- 


тем с треугольными матрицами коэффициентов. 
Получим сначала формулы для вычисления элементов у; 


вспомогательного вектора у. Для этого запишем уравнение 
Гу =Ь в развернутом виде: 


АУ + 1122 +й ла У = 6; . 
Очевидно, все У могут быть последовательно найдены при 
1=1,2, й ‚п по формуле 


4 
яЯ=Ь- УП кУк. (2.11) 
А 
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Развернем теперь векторно-матричное уравнение Ох=у: 


и1 1х1 + И12х2+ Йй + щи =У , 


(2.12) 


ИпиХи = Уп. 
Отсюда значения неизвестных х; находятся в обратном порядке, 
т.е. при 1=и,п-—1)й ,2,1, по формуле 


п 
Хх = = Учи : (2.13) 
ый К=Н 

Итак, решение СЛАУ посредством ГО-факторизации сво- 
дится к организации вычислений по четырем формулам: сово- 
купности формул (2.9), (2.10) для получения матрицы &-+9-Е 
(2.8) ненулевых и неединичных элементов матриц для в и №, 
формулы (2.11) для получения вектора свободных членов тре- 
угольной системы (2.12) и формулы (2.13), генерирующей реше- 
ние исходной системы (2.1). 

Обратим внимание на тот факт, что выполнение расчетов по 
формулам (2.9)—(2.11) можно интерпретировать как преобразова- 
ние системы (2.1) к треугольной системе (2.12). С системой (2.3) 
— результатом прямого хода метода Гаусса — последняя имеет 
не только структурное сходство, но полностью совпадает с ней 
(совпадение первых уравнений очевидно, коэффициенты при не- 
известных и свободные члены вторых уравнений легко выража- 
ются одинаково через исходные данные; можно и дальше прово- 
дить сравнение систем (2.3) и (2.12) таким путем, однако обычно 
идентичность этих систем показывают проще на основе пред- 
ставления прямого хода метода Гаусса как последовательности 
умножений матрицы А слева на матрицы очень простой струк- 
туры такой, что в итоге получается матрица 9, а последователь- 
ность обратных преобразований дает 1, [3, 74, 158, 183]. Так что 
решение линейных систем с помощью О-разложения — это 
просто другая схема реализации метода Гаусса. В отличие от 
рассмотренной в $ 2.1 так называемой схемы единственного де- 
ления эту называют компактной схемой Гаусса [43, 180] или 


схемой Холеикого”) [61]. 


* ’ 
) Андре-Луи Холецкий (1875—1918) — французский военный геоде- 
зист. 
Чаще схемой Холецкого называют описываемый в следующем пара- 
графе основанный на той же идее способ решения симметричных 
линейных систем (метод квадратных корней). 
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Вычисление определителя 1.О-факторизованной матрицы А 
опирается на свойство определителя произведения матриц и сво- 
дится к перемножению и чисел: 


Че! А = деЕ Г. . де Ч =и\1 -и52 -Й "`Ипи : 


Для обращения матрицы А с помощью ГО-факторизации 
можно применить тот же прием, который рассмотрен в $ 2.2, т.е. 
п-кратно использовать формулы (2.11) и (2.13) для получения 
столбцов матрицы А; при этом в качестве Б; в (2.11) должны 
фигурировать только 0 или 1: для нахождения первого столбца 
А-' полагаем Ы =1, 52 =Б3 =Й =В, =0, для второго — Б› =1, 
Ы =Бз =Й =ЁБ, =0, и т.д. Можно однако вывести и специальные 
формулы для выражения элементов обратной матрицы через эле- 
менты матриц Г, и 9. Продемонстрируем это. 

Пусть матрицы А и О обратимы (матрица Г, обратима все- 
гда). Тогда 


А=Г.0 <> АЙ 
Умножая последнее равенство поочередно на Ц слева и на [ 
справа, будем иметь 
ПА=Г! и АМ, = 1. (2.14) 
Обозначим, как и ранее, искомые элементы матрицы А! через 
х; ;. Учитывая, что треугольные матрицы при обращении сохра- 


няют свою структуру, перепишем равенства (2.14) в следующем 
виде 


И11 И]2 [ И] и ^1 ^2 ( Хи 1 0х 0 
0 и22 ГА И2 и Х21 Х22 Ё Х2и |_ «100 
ЮО мля Я я 1 
Хх 2х2 [ Хи 1 00 жж жж 
Х21 Х22 6 Хи 151 ео № О*жг + 
а $ АЕ В 1 00& * 


Звездочкой здесь обозначены некоторые числа, указывающие на 
структуру матрицы (знание которых для дальнейшего не требу- 
ется). Полученные матричные равенства можно рассматривать 


как систем п авнений п неизвестными Х;; 
а сте 2 с и? неизвес 2] 
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(2 7=Ъ2,Й ‚п). Из этих 2п? уравнений ровно и” имеют извест- 
ные правые части (0 или 1). Выпишем соответствующую им 
пхп-матрицу уравнений: 


ихи+й +и хи =Ь ИЯ2+Й +щиХ,2=0, й, ии +й + иди =0, 
хо1+Й +х2и=0, иоохоо+Й +и2ихи2=1, Й, иохои+Й +ио их =0, 
хи +й +" =0, Хи +й +2 =0, й , ии ихив =1. 


Короче все эти уравнения могут быть представлены следующими 


) 


* 
тремя типами связеи *: 


п 

Ущиьхь:=0, если! <], 
= 

и. . . 
Ущиьхьу=1, если =] 
= 


п 
у + ЖЕ =0, если 7> 7]. 


А=/-+1 
Отсюда можно выразить все элементы х;; искомой обратной 
матрицы А-1: 
1 п 
= 1- У ИТКХК | . (2.15) 
е к=7Н 
| а 
жу=-— Ушихь, (<); (2.16) 
Ир = 
п. . . 
х: == мил. (2.17) 
К=] +1 


Формулы (2.15)-(2.17) позволяют эффективно обращать 


*) 1, если 1=)], 
Используя символ Кронекера бу и ‚ `_ ‚ Первые две 
0, если 1] 
формулы можно совместить: 


п 
Уигкхк у =, у. 
К= 

Это относится и к формулам (2.15), (2.16). 
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ГО -факторизованную матрицу, если соблюдать определенную 
технологию их использования. А именно, как видно из записан- 
ной выше матрицы уравнений, следует сначала из последнего 
столбца уравнений найти х„„, хи, Й ‚Хи, хи, Затем из 
оставшейся части последней строки уравнений найти 
Хи, п-1ьЙ ,Хи2,Хи1, ПОТОМ переключиться на предпоследний 
столбец и т.д. Схематично последовательность вычислений 


элементов обратной матрицы можно изобразить пронумерован- 
ными стрелками следующим образом: 


1 ыы ал 1 


При этом стрелка 1 означает, что фиксируем /=и и ведем счет 
по формулам (2.15), (2.16) при 1=и,п-Ъй ‚1; стрелка 2 — счет 
по формуле (2.17) при {=пи 1=и-Ьи-2,й ‚1, ит.д. 


Возвращаясь к началу $ 2.3, заметим, что так же употреби- 
тельно фиксирование единичной диагонали у правой треуголь- 
ной матрицы, т.е. представление матрицы А в виде 


ат ар @ а») [1 0 @ 0\ [1 и и 
аз1 422 @ аи |112 0 |0 ТЕ и 


21 Я @ @л та Ё Ба 002 1 


В этом случае /; ; и и; ‚ находятся по формулам 
1—1 
11=а;-УЙкик у (> 7), 
К=1 


| 
и, = 


Е 
тя 4: — ДЕНЬ (<), 
1 К=1 


где индексы фиксируются так, чтобы вычислялись поочередно 


столбец (1;1),›|, затем строка (и } Ра ит.д. 
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Решение системы (2.1) с таким образом факторизованной 
матрицей коэффициентов получают по формулам 


1 2 , 
НР. Ь- У кУь , ий 
й К=1 


п 
х=у- Ущшихь, Т=пи,п-ЬЙ „1. 
= 
Детерминант матрицы А равен произведению /11/22й [1и, а для 
подсчета элементов обратной матрицы используют совокупность 
формул 


1 п 
хн=—1- ХжЫы 
н В 
| 5 
ж`:==— Хжыь, @>Л) 
РЕНН 


Ы 7 ин (< 


с такой организацией вычислений, при которой сначала вычисля- 
ется последняя строка („ при /=и,п-1й ‚1, затем послед- 
ний столбец (х;„) при 1=и-—1й ,1, потом предпоследняя строка 
и; при /=и-Ьй ‚1, ит.д. 

В отличие от рассмотренной в $ 2.1 схемы единственного 
деления схема Холецкого менее удобна для усовершенствования 
с целью уменьшения влияния вычислительных погрешностей пу- 
тем выбора подходящих ведущих элементов. Достоинством же ее 
можно считать то, что [О-разложение матрицы А играет роль 
обратной матрицы, может помещаться в память компьютера на 
место матрицы А и использоваться, например, при решении не- 
скольких систем, имеющих одну и ту же матрицу коэффициентов 
и разные правые части. 


Замечание 2.1. Некоторое усложнение процедуры ГО-факториза- 
ции позволяет применять ее в более широких условиях. А именно, для 
любой невырожденной квадратной матрицы А можно подобрать такие 
матрицы перестановок Р и О, что будет осуществимо /ЮО-разложение 
матрицы РАО (причем это может быть сделано так, чтобы минимизиро- 
вались вычислительные погрешности, т.е. реализовывалась стратегия вы- 
бора главного элемента). Решение системы Ах-=Ь в таком случае нахо- 
дится следующим образом. Полагаем х=ФОх, где # — вспомогательный 
вектор. Тогда исходная система принимает вид АО#=Ь; умножив по- 
следнее равенство слева на матрицу Р, приходим к эквивалентной систе- 
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ме РАО 2 = РБ, которая, в свою очередь, может быть представлена в виде 
Ш*=РЬ. Далее последовательно решаются треугольные системы 
Гу =РЬ и 0О2=у относительно вспомогательных векторов у и 1 соот- 
ветственно, после чего вычисляется искомый вектор х=О2. Вся слож- 
ность реализации такой схемы состоит в конструировании подходящих 
матриц перестановок Р и О. 


Пример 2.2. Для матрицы А примера 2.1 выполнить О-разложе- 


ние и с его помощью найти второй столбец матрицы д, 
По формулам (2.9), (2.10) последовательно вычисляем: 


1 =а1=2, и2 =а]2 =-1, ШЗ =аз =1; 
_ а21 _ 4 @31 6 


О ыы 
ы и 1 2 ы и] 1 2 


и22 = а22 - Ба =3-2(-=5, из =а23 -ущз =1-2.1=-1; 
[32 и — [31 == 
и22 5 

из3 = @зз — [31 13 - [32 И2з =6-3-1- (-2)(-0=1. 

Таким образом, равенство А = 1.0 в данном случае выглядит так: 
2-11 100 (2-11 
431=210:05-1 
6 —136 3—21\0@ 1 

Хранить это разложение можно в виде матрицы 


2 = 1 
Г-Е+0=|2 5 -1 
9—9 1 


Чтобы найти требуемый по условию второй столбец матрицы А- 
(обозначим его хо = (х12; х22; хзо )"), воспользуемся тем, что его можно 
считать решением векторно-матричного уравнения 


Ах> =е>, где е› = (0; 1507. 

Наличие 1] -разложения матрицы А позволяет свести это уравнение к двум 
более простым. Именно, сначала решаем уравнение Шу =е> ‚ т.е. систему 

я =0, 

21 + у2 =1, 

ЗУ: - 2у2+уз =0, 
получив при этом у=(у1; у2; уз)/ = (0;1;2)', а затем — аналогичное 
уравнение Ох) =у, также представляющее собой в развернутом виде 


7 


треугольную систему 
2х12 —Х22 +Х32 =0, 
5х22 —#Х32 =1, 
Х32 = у 


из которой находим хо. = (- 0.7; 0.6; 2)". Следовательно, обратная к А 
матрица имеет вид 


* —0.7 * 
А-'=|* 0.6 *|. 
«ж 2 жж 


Заметим, что, во-первых, последние две системы можно было и не 
выписывать, а выполнить вычисления непосредственно по формулам 
(2.11), (2.13); во-вторых, перемножением элементов #1, #22, изз легко 
убедиться, что при этом получается то же значение 4еЁ А, которое было 
получено иначе в примере 2.1. 


2.5. РАЗЛОЖЕНИЕ СИММЕТРИЧНЫХ МАТРИЦ. 
МЕТОД КВАДРАТНЫХ КОРНЕИ 


Объем вычислений, требующихся для решения линейных 
алгебраических задач с симметричными матрицами, можно со- 
кратить почти вдвое, если учитывать симметрию при треуголь- 
ной факторизации матриц. 


Пусть А= (а, ‚}". —щ данная симметричная матрица, т.е. 


у 
а; ; =ау;. Будем строить ее представление в виде А = ого ‚ где 
ии 12 й Ши ии Ой 0 
0 ий и и ид й 0 
и 22 2" ЦГ- 
о О Лы И] И Й И 


Аналогично тому, как это делалось в $ 2.3, составим систему 
п(п+1) . 
—^ — уравнений относительно такого же количества неизвест- 


ных (элементов матрицы 0): 


2 
и |1 =а11, И12И 1 =а12, @ , ии =Чи, 


2. 9 
и] +52 =а22, @ , Шри и +и2и п =а2и, 


2 2 2 
ии, +Й ии =@ли. 
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Из первой строки уравнений находим сначала и11 = уа11 ‚ затем 


а]; 
ит; ыы при /=2,Й , п. Из второй — и2о =\а22 = ‚ затем 
И 
у НВ : 
из 5—1 о при /=3,й ‚и, и тд. Завершается процесс 
0, 
вычислением 


Таким образом, матрица Ч может быть определена сово- 
купностью формул 


ры 
ас Уи: нри #=1, 2, й, м; 
= 


В 
а} 2 ии} (2.18) 
ый 


и = ЕР при /=2,й, пт; >: 


И 


(и; =0 при 1<). 


Осуществимости вещественного 0/0 -разложения вещественной 
симметричной матрицы А по этим формулам могут помешать 
два обстоятельства: обращение в нуль элемента и;; при каком- 
либо 1е{1,2,й ‚ п} и отрицательность подкоренного выражения. 
Известно, что для важного в приложениях класса симметричных 
положительно определенных матриц разложение по формулам 
(2.18) выполнимо [42, 180 и др.] . 

При наличии 00 -разложения решение симметричной 
системы Ах=Ь сводится к последовательному решению двух 
треугольных систем 


ОГу=ь и Ох=у. 


= 
) Более универсальным, чем 070 -разложение Холецкого, являет- 


* 
ся 0 ОО-разложение, пригодное для эрмитовых матриц, частным случа- 
ем которых являются симметричные (см., например, [12, 42, 158]). 
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Первая из них имеет вид 
111 =Ы, 
и12 1 +222 =5>, 


Чи +И2 вУ2 +Й +и1пУи =В, 
откуда получаем вспомогательные неизвестные у1, у2,й ‚ у„ по 
формуле 


| 
в;— Умер 
А=1 
$ (2.19) 
и 
полагая в ней 1=1,2,й ‚и. Из второй системы 


#111 + и12Х2 +Й +щихи =, 
и22х2 +Й +и2ихи =У2, 


п =Ун 
находим искомые значения х; в обратном порядке, т.е. при 1=и, 
п-1,й ‚1, по формуле 


п 
И У игкхк 
х=— Е. (2.20) 
и: 

Решение симметричных СЛАУ по формулам (2.18)—(2.20) 
называют методом квадратных корней или схемой Холеикого. 
В случае систем с положительно определенными матрицами 
можно ожидать хороших результатов применения такого метода 
(особенно, если в процессе решения делать проверку на нема- 
лость |и;;|, чтобы избежать большого роста погрешностей). В 
противном случае нет, например, гарантий, что в процессе раз- 
ложения не появятся чисто мнимые числа, что кстати может не 
отразиться на результатах, если в алгоритме реализации метода 
квадратных корней предусмотреть возможность появления мни- 
мых чисел [180]. 
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2.6. МЕТОД ПРОГОНКИ РЕШЕНИЯ СИСТЕМ 
С ТРЕХДИАГОНАЛЬНЫМИ МАТРИЦАМИ 
КОЭФФИЦИЕНТОВ 


Часто возникает необходимость в решении линейных ал- 
гебраических систем, матрицы которых, являясь слабо заполнен- 
ными, Т.е. содержащими немного ненулевых элементов, имеют 
определенную структуру. Среди таких систем выделим системы 
с матрицами ленточной структуры, в которых ненулевые элемен- 
ты располагаются на главной диагонали и на нескольких побоч- 
ных диагоналях. Для решения систем с ленточными матрицами 
коэффициентов метод Гаусса можно трансформировать в более 
эффективные методы. 

Рассмотрим наиболее простой случай ленточных систем, 
к которым, как увидим впоследствии, сводится решение задач 
сплайн-интерполяции функций, дискретизации краевых задач 
для дифференциальных уравнений методами конечных разно- 
стей, конечных элементов и др. А именно, будем искать решение 
такой системы, каждое уравнение которой связывает три «сосед- 
них» неизвестных: 


Бух +сах: +Ахн =7, (2.21) 
где 1=1,2,Й ‚и; В =0, 4, =0. Такие уравнения называют 
трехточечными разностными уравнениями второго поряд- 


* 
ка’). Система (2.21) имеет трехдиагональную структуру, что хо- 
рошо видно из следующего, эквивалентного (2.21), векторно- 
матричного представления: 


40 0й 0 0 0 х " 
Ь> со 42 0 0 0 0 № 1) 
ОБ 0 0 0 мт 
я в в чё в 3 35 =. Е 
оо Вс Ч Хи-1 тт 
| боб © В || || 


* 
) Чаще вместо принятой здесь записи системы (2.21), предпола- 
гающей как бы наличие фиктивных неизвестных хо и х„.1 с нулевыми 


коэффициентами, считают в (2.21) Г изменяющимся от 2 до и-1, выделяя 
первое и последнее уравнения системы соответственно 


ехм+алх =п и Вх +ех=и 
в отдельные строки (так называемые краевые условия разностного урав- 
нения). О разностных уравнениях см. далее $ 16.3. 
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Преследуя, как ив $ 2.1, цель избавиться от ненулевых эле- 
ментов в поддиагональной части матрицы системы, предполо- 
жим, что существуют такие наборы чисел б; и Я; (1=1,2,й ‚п), 
при которых 


хр = р, (2.22) 
т.е. трехточечное уравнение второго порядка (2.21) преобразует- 
ся в двухточечное уравнение первого порядка (2.22). Уменьшим 
в связи (2.22) индекс на единицу и полученное выражение 
Х1=д; 1х; +А 1 Подставим в данное уравнение (2.21): 
Ббрлх + 1 +сх:+4хьа =тЬ, 
откуда получаем 
в а, по 
И а 
с +0 +011 


Последнее равенство имеет вид (2.22) и будет точно с ним совпа- 
дать, иначе говоря, представление (2.22) будет иметь место, если 
при всех 1=1,2,й ‚ и выполняются рекуррентные соотношения 


И а; __ ИВ 
гы , го $ 
с +6:б с +Ь:б1 
Легко видеть, что, в силу условия Ь; =0, процесс вычисле- 
ния д;, Д; может быть начат со значений 


(2.23) 


и продолжен далее по формулам (2.23) последовательно при 
1=2,3,й ‚п, причем при 1=пи, в силу 4, =0, получим д, =0. 
Следовательно, полагая в (2.22) 1= и, будем иметь 


— = Г =: Г | 
Хи =Ли 
Сп +69 
(где Я, 1, 0,1 — уже известные с предыдущего шага числа). 


Далее по формулам (2.22) последовательно находятся 
Хи1ь Хи2,й ‚м При 1=п-1,п-—2,й ‚1 соответственно. 
Таким образом, решение уравнений вида (2.21) описывае- 
* 
мым способом, называемым методом прогонки ), сводится к 


* 
) Термин, характерный, в основном, для отечественной литературы 
по вычислительной математике, введен в 50-х годах ХХ века (см., напри- 
мер, [3, 55, 111]). 
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вычислениям по трем простым формулам: нахождение так назы- 
ваемых прогоночных коэффициентов 6;, Л; по формулам 


(2.23) при 1=1,2,й ‚п (прямая прогонка) и затем получение не- 
известных х; по формуле (2.22) при 1=и,п-1й ‚1 (обратная 
прогонка). 


Для успешного применения метода прогонки нужно, чтобы 
в процессе вычислений не возникало ситуаций с делением на 
нуль, а при больших размерностях систем не должно быть быст- 
рого роста погрешностей округлений. 

Будем называть прогонку корректной, если знаменатели 
прогоночных коэффициентов (2.23) не обращаются в нуль, и ус- 
тойчивой, если |6; | <1 при всех 1еЕ 1,2,й ‚п}. 

Приведем простые достаточные условия корректности и ус- 
тойчивости прогонки, которые во многих приложениях метода 
автоматически выполняются. 

Теорема 2.2. Пусть коэффициенты БЬ; и а, уравнения 

(2.21) при 1=2,3,й ‚п-1 отличны от нуля и пусть 


> + У 1=1,2,й $72: (2.24) 
Тогда прогонка (2.23), (2.22) корректна и устойчива 
(т.е. С +Ь;9;1 = 0, [6 < 1) 


Доказательство. Воспользуемся методом математиче- 
ской индукции для установления обоих нужных неравенств од- 
новременно. 

При 1=1, всилу (2.24), имеем: 


|[>! [20 
— неравенство нулю знаменателя первой пары прогоночных ко- 
эффициентов, а также 
а 
[61| = вы <1. 
= 
Предположим, что знаменатель (1—1)-х прогоночных коэф- 
фициентов не равен нулю и что [б,; ||<1. Тогда, используя свой- 


ства модулей, условия теоремы И индукционные предположения, 
получаем: 
[+6 > [ей -|6:6 > 6+6 |= 
=“; + а-|6.) >; >0, 
ас учетом этого 
6|=|- а; = |“; < 
с+Ь6б |6+66,1| |4) 
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Следовательно, с; +Ь;6;1*0 и |[6;|<1 при всех {Е Й,2,й ‚п}, 
т.е. имеет место утверждаемая в данных условиях корректность и 
устойчивость прогонки. Теорема доказана. 


Пусть А — матрица коэффициентов данной системы (2.21), 
удовлетворяющих условиям теоремы 2.2, и пусть 
а Ч; ь 
5 =--1, 9; =- : (=а,З.й ‚п-1), 6, =0 
с с +6 д 
— прогоночные коэффициенты, определяемые первой из формул 
(2.23), а 
А; =: +В:0:1 ((=2,3,й ‚п) 
— знаменатели этих коэффициентов (отличные от нуля согласно 
утверждению теоремы 2.2). Непосредственной проверкой легко 
убедиться, что имеет место представление А = О, где 
Га 0 0 0 0 оо 


65 о 0О0й 0 00 


г-| 0 3 А 0 0 00| 
оо 00й ВА, 0 
Оооо ОБА 
1-5 0 бло0 о] 
отд, оло0 0 

и 0 0 т -6й 00 о | 


бо а бот 
оо о ойо0 1 


единственное в силу утверждения теоремы 2.1. Как видим, 
[Л/-разложение трехдиагональной матрицы А может быть вы- 
полнено очень простым алгоритмом, вычисляющим ДА; и д; при 
возрастающих значениях 7. При необходимости попутно может 
быть вычислен определитель: 


И 
ег А =с1 ПА; . 
1=2 
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Пример 2.3. Методом прогонки решить систему 


2х  +^2 = -—10, 
2м +9х) +253 = -26, 
4х» +17хз -4х4 = -—16, 
4х3 +15х4 -8х5 = -2, 

2х4 +3х5 = 16 


и вычислить определитель матрицы ее коэффициентов. 
Данная система состоит из уравнений вида (2.21), где Б;, с;, Ч 
суть элементы векторов 


Г) 


0 2 1 —10 
2 9 2 —26 
Ь=4|, с= 17|, 9=-4| и г=| -16 
+ 15 _8 2 
2 3 0 16 


соответственно. Налицо диагональное преобладание в матрице системы, 
означающее, что ни при каком 1 е {1, 2, й ,‚ 5} величина 


А; =С; +В; 0 


не обратится в нуль (корректность) и что при вычислении прогоночных 
коэффициентов д;, 4; по формулам 

и -Ь А | 
==, и (=Ь2,й , 5) 


1 


абсолютные величины всех 6; окажутся меньшими единицы (устойчи- 


вость). 
Полагая последовательно 1=1, 2, й ‚5, имеем: 
а -- 
А 2 А 2 
4 | т — 21 
До =с2 +261 =8, 00 ==—=--, 12 = =-2; 
р — 627628] о Аз д 2 А) 
4 _1 73 — 6342 __1 
Аз = 36 =16 б==—=-, Яз = ==; 
3=63 +0302 , 3 Аз 4 :] гв 2 
44 _1 74 Бал 
Ад =сд +6403 =16 ба=-=—=— й 0; 
4 =С4 +5403 ‚ 4 У 2, 4 Ад ; 
а —65 4. 
ДА; = 65 +6504 =4, 95 В. #5 Ив. 
А; Д5 
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Обратная прогонка по формуле (2.22) при 1=5, 4, й ‚| дает искомые 
значения неизвестных: 


Х5 = #5 =4, 
Х4 =д4 Х5 + 14 =54+0=2, 


Хз = 03х4 + Аз =1.2+6)=0, 


Хх =д2 Хз + 12 =-4:0+(2)=-2, 


ж=61х2 +#1 =-7-С2) +55) =-4. 


Для вычисления определителя матрицы А коэффициентов данной 
системы, как показано выше, достаточно перемножить пять чисел: 


Э 
4еА=[] А, =2.8.16.16.4=16384. 


= 


В заключение этого параграфа заметим, что, во-первых, 
имеются более слабые условия корректности и устойчивости 
прогонки, чем требуемое в теореме 2.2 условие строгого диаго- 
нального преобладания в матрице А (см., например, [44, 111, 
158, 161]). Во-вторых, применяется ряд других, отличных от рас- 
смотренной нами правой прогонки, методов подобного типа, ре- 
шающих как поставленную здесь задачу (2.21) для систем с трех- 
диагональными матрицами (левая прогонка, встречная прогонка, 
немонотонная, циклическая, ортогональная прогонки и т.д.), так 
и для более сложных систем с матрицами ленточной структуры 
или блочно-матричной структуры (например, матричная прогон- 
ка). Выводы и исследование различных вариантов метода про- 
гонки можно найти, например, в [76, 161]. 


2.7. МЕТОД ВРАЩЕНИЙ РЕШЕНИЯ 
ЛИНЕИНЫХ СИСТЕМ 


Вернемся к рассмотрению линейных систем общего вида 


(2.1). 
Предположим, что методом Гаусса решается система 
Ах = Ь с матрицей коэффициентов 


1001 

1101 
А= 

1-1 11 

1-11-11 
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* 
Приведение такой системы к треугольному виду прямым ходом 
метода Гаусса равносильно следующей последовательности эк- 
вивалентных преобразований матрицы А: 


1001 1001 1001 
0102 0102 0102 
0—1 12 00 14 0014 


0.1, =. 2 00-14 0008 


Очевидно, в случае ихи-матрицы такого типа прямой ход метода 


Гаусса допускает рост элементов матрицы до величины бт, 
При больших и это может привести если не к переполнению раз- 
рядной сетки компьютера, то к сильному влиянию погрешностей 
округлений, причем в данной ситуации не даст эффекта и по- 
столбцовый выбор главного элемента. 

Рассмотренный пример оправдывает поиск других подходов 
к построению прямых методов решения линейных систем (2.1), 
возможно, более сложных, чем метод Гаусса, но не допускающих 
большого роста элементов в процессе преобразований и как 
следствие численно более устойчивых. 

Как и в методе Гаусса, цель прямого хода преобразований в 
новом методе — приведение системы к треугольному виду 
последовательным обнулением поддиагональных элементов сна- 
чала первого столбца, затем второго и т.д. Делается это следую- 
щим образом. 

Пусть с1 и 5| — некоторые отличные от нуля числа. Умно- 


жим первое уравнение системы (2.1) на с1, второе — на $51 и сло- 
жим их; полученным уравнением заменим первое уравнение сис- 
темы. Затем первое уравнение исходной системы умножаем на 
— 51, второе — на с1 и результатом их сложения заменяем второе 


уравнение. Таким образом, первые два уравнения системы (2.1) 
заменяются уравнениями 


(стан + я1азу)жи + (стало + 51422 )хо +й + (стаи + 51а2и)хи = 
= сб + $162 5 
(- яа + сла21 хи + (- 51а12 + с1а22 )хо +й + (- чаи +1а2и)хи = 


= —$5161 + 1 * 


* 
) Пример заимствован из [74]. 
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На введенные два параметра с| и $1 наложим два условия: 


— ман + с1а21 =0 


— условие обнуления (т.е. исключение х| из второго уравнения) и 
с? 4 =1 


— условие нормировки. Легко проверить, что за с] и 51, удовле- 
творяющие этим условиям, можно принять соответственно 


Ч | 921 


СЫ = Е 
ай +а21 ай +а21 


Эти числа можно интерпретировать как косинус и синус некото- 
рого угла а! (отсюда название метод вращений, так как один 
промежуточный шаг прямого хода такого метода может рассмат- 
риваться как преобразование вращения на угол а; расширенной 
матрицы системы в плоскости, определяемой индексами обну- 
ляемого элемента )). 

После фиксирования с] и $1 способом (2.25) система (2.1) 
принимает вид 


с] = (2.25) 


ах + ах. +Й + ах, = 0, 


ах +й +ах, = ь, 
азуХ1 + аз2хо +й +азих, = В, (2.26) 


а,1м +а2х5 +й +аих, = В, 
где 
1 . 1 : 
а = са } +914. } (Т=Ъа,й ‚п), ЫЙ = ав +516 у 
(1) 
Далее первое уравнение системы (2.26) заменяется новым, полу- 


ченным сложением результатов умножения первого и третьего 
уравнений (2.26) соответственно на 


=-51а1 ; +с1а2 ; (7=2.3. м), ь) == +с1Во. 


*) Более подробно эта интерпретация, как и вообще идея ортого- 
нальных преобразований, будет рассмотрена позже применительно к ре- 
шению полной алгебраической проблемы собственных значений (см. $$ 
4.4, 4.6). Там же, в замечании 4.10 описан другой способ численно устой- 
чивого решения СЛАУ — метод отражений. 
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СЕРА И 5 =, 
о 


а третье — уравнением, полученным сложением результатов ум- 
ножения тех же уравнений соответственно на —52 и со. Получа- 
ем систему 

(2) (2) 


ат м чар хо +й чаи хи =В, 


а41х1 +а4охо +й +а4ихи = В, 
аитхт + аи 2х2 +й +аиихи = Вы, 
где 
а са +в; ()=Ь2,й, п), БО =е>ь® +8563; 
а) =-вра +езаз} (1=2,3,й п), О = 525 + сов . 


Проделав такие преобразования п-1| раз, придем к системе 


ан ^х ча" Эх, +йЙ ча" 0х, = "9, 


або +в чак, = 8), (2.27) 
ах. +Й ча х, = РО 


такого же вида, какой приняла система (2.1) после первого этапа 
преобразований прямого хода метода Гаусса. Однако в отличие 
от (2.2) система (2.27) обладает замечательным свойством: длина 
любого вектора-столбца (иначе, евклидова норма) расширенной 
матрицы системы (2.27) остается такой же, как у соответствую- 


* 
щего столбца исходной системы (2.1) ). Чтобы убедиться в этом, 


* 
) Разумеется, в предположении точной реализации метода, в част- 
ности, формул типа (2.25). 


83 


достаточно посмотреть на результат следующих преобразований, 
учитывающих условия нормировки: 


(1) } + ( (1) а 2 5.5 5 
(20 а; ) = = с? а; + 2151 а ;а2 } +5145; +51 а’, - 2с151ац ;а> } + 
2:2 2 2% 52 2 2 2 2 2 
+ стар} = (1 +51 )а1; + (1 +51)а2 ; =а1; +а> у. 
Он показывает сохранение величины суммы квадратов изменяе- 
мых на данном промежуточном шаге преобразований пары эле- 
ментов любого столбца; так как остальные элементы столбцов 
при этом остаются неизменными, то, значит, на любом этапе 
преобразований длина столбца будет одной и той же, т.е. не бу- 
дет наблюдаться роста элементов (но какой ценой это достигает- 
ся — коэффициенты первого уравнения пересчитываются и-—1 
раз!). 
Дальше точно так же за и-2 промежуточных шага преоб- 
разуем подсистему 


ах +й ча х, = ь, 


ах. +й ча х, =50 


системы (2.27), создавая нули под элементом а), ит.д. 


В результате ип-—1 таких этапов прямого хода исходная сис- 
тема (2.1) будет приведена к треугольному виду (ср. с (2.3) 
в$ 2.1): 


а" ур ча", +Й ча" 0х, = "0, 


а" Эх. +Й на" = ь"-0, 
ах, ре ы" 1. 


Нахождение отсюда неизвестных х„,х„_1,й ‚Хх! не отличается от 
рассмотренного ранее обратного хода метода Гаусса. 
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2.8. ДВА ЗАМЕЧАНИЯ К ПРИМЕНЕНИЮ 
ПРЯМЫХ МЕТОДОВ 
1. О КОНТРОЛЕ ТОЧНОСТИ И УТОЧНЕНИИ ПРИБЛИ- 
ЖЕННОГО РЕШЕНИЯ В РАМКАХ ПРЯМОГО МЕТО- 


ДА 
Как отмечалось в $ 2.0, прямые методы приводят к точному 


решению СЛАУ при точном выполнении предусматриваемых 
соответствующими алгоритмами арифметических операций (без 
округлений). Реальные же вычисления базируются на арифмети- 
ке машинных (т.е. усеченных до определенного количества раз- 
рядов) чисел. Как отражается на результате решения системы 
подмена арифметики действительных чисел машинной арифме- 
тикой, зависит от самой решаемой системы, параметров приме- 
няемого компьютера и системы представления данных, способов 
реализации алгоритмов (см. по этому поводу, в частности, гл. 1). 
В любом случае, практически вместо точного решения СЛАУ 
(2.1) прямой метод дает приближенное решение °) (обо- 


значим его х ы ). Подставив х(0) в выражение 


&:=Ь- Ах, 
называемое невязкой, по малости полученного вектора-значения 
&(0) =6-— Ах(0) можно с осторожностью судить о близости най- 
денного решения х(0) к точному решению х. Если, например, 
[Е®] — недостаточно малая величина, то следует искать вектор- 
поправку р такой, что х(0) +р=х есть точное решение системы 
(21). те. 

А( ©) + р)= Ь. 

Последнее равносильно векторно-матричному уравнению 

Ар=ё С 
Как видим, нахождение поправки сводится к решению такой же 
системы, как и (2.1), где в качестве вектора свободных членов 
должен быть взят вектор невязок. Поскольку матрица коэффици- 


ентов осталась той же, что и у исходной системы, нет надобности 
в выполнении прямого хода преобразований коэффициентов при 


* 
) Например, метод Гаусса порождает относительную ошибку ре- 
шения порядка О п.2-!. сопа А ‚ где / — число двоичных разрядов, вы- 
деляемых компьютером под мантиссу вещественного числа [158]. 
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неизвестных (иначе, ГО-разложения); достаточно выполнить 
только действия, касающиеся новых свободных членов (решить 


две треугольные системы: 11 = (©) и Ор=2). Прибавив най- 
денную поправку р=р@®) | х(0), получаем уточненное прибли- 


женное решение х(0) = х(0) +р©). В случае, если величина | 


(или Ио, если контролируется относительная, 
а не абсолютная погрешность) окажется недостаточно малой, 
процесс уточнения может быть повторен: ищется поправка р) 
как приближенное решение уравнения Ар=ё(, где 
Е =ь—Ах(; тогда более точным должно быть решение 


х(2) = х() +р®. Как аргументировано утверждается в [42], схо- 
димость к нулю невязок в таком процессе уточнения решения 


может не наблюдаться”), т.е. следить нужно за установлением 
знаков самого решения. Обычно делают не более двух-трех ша- 
гов уточнения, причем рекомендуется производить вычисление 
невязок в режиме накопления. Если в этом процессе не происхо- 


дит сближения х(® при К=2,3, то это говорит скорее всего о 
том, что данная система плохо обусловлена и ее решение не мо- 
жет быть найдено с требуемой точностью без привлечения до- 
полнительной информации об исходной задаче. В таких случаях 
закономерно ставить вопрос о том, что понимать под точным 
решением системы и, возможно, обращаться к методам нахожде- 
ния ее псевдорешений (достаточно глубокие исследования за- 
тронутых здесь вопросов, основанные на изучении поведения 
методов при введении ошибок в исходные данные, а также ряд 
других сведений, в частности, точностные характеристики пря- 
мых методов, можно найти в [42]). 

Хотя описанный здесь контроль точности по невязкам и 
уточнение решений не требует больших вычислительных затрат, 
требуемая память компьютера должна быть увеличена вдвое, так 
как при этом нужно удерживать в памяти исходные данные. 


Е 
) См. также пример поведения невязок у плохо обусловленной сис- 
темы на приближённых решениях в гл. 1 ($5 1.4, 1.5). 
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2. О ВЫЧИСЛИТЕЛЬНЫХ ЗАТРАТАХ 


Одним из факторов, предопределяющих выбор того или 
иного метода при решении конкретной задачи, является вычис- 
лительная эффективность метода. Особенностью прямых мето- 
дов является то, что здесь можно точно подсчитать требуемое 
количество арифметических операций. Приведем пример такого 
подсчета для метода прогонки решения п-мерной системы с 
трехдиагональной матрицей коэффициентов (см. $ 2.6). Необхо- 
димые операции и их число наглядно видны из табл. 2.1 (где вы- 
читание отождествляется со сложением): 


Таблица 2.1 


Подсчет арифметической сложности метода прогонки 


Расчетные формулы метода прогонки Умно- | Делений | Сложений 
жений 


А; =с;+6;0;1 (1=2, й , п) 


Учитывая, что часто операции сложения выполняются на- 
много быстрее, чем умножения и деления, обычно ограничива- 
ются подсчетом последних. Так, аналогично показанному не- 
трудно проверить, что для решения и-мерной СЛАУ методом 

с 
п 2 п 
Гаусса (без выбора главного элемента) требуется ее -* ум- 


* 
ножений и делений ), а методом квадратных корней — 


3 
п п а 
я +— плюс и операций извлечения корня (см. [20, 158, 


* 

) Несложно подсчитать и общее число операций, включая сложе- 
ние [43, 44, 61], а также время решения и-мерной системы, если известна 
скорость выполнения различных операций [29]. 
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180 и др.]). Метод вращений предполагает вчетверо больше опе- 
раций умножения, чем метод Гаусса [74]. При больших значени- 
ях размерности и существенным является старший член выраже- 
ния для подсчета числа арифметических операций (иначе, 
арифметической сложности метода). Можно сказать, что вы- 


числительные затраты на операции умножения и деления в мето- 
я 
де Гаусса составляют величину О | в методе квадратных 


о из о 4 3 
корней О = ‚ в методе вращений О эй ‚ в то время как про- 


гонка требует всего О(5п) таких операций. 


УПРАЖНЕНИЯ 

2.1. А) Решите систему 
0.1% + 2% - 10х3 = 0.6, 
0.3х; + 6.01х5 - 25х3 = 1.852, 
0.4х| + 8.06х› + 10.001х3 = 2.91201 


методом Гаусса, пошагово выполняя предписания алгоритма из $ 2.1. 


Б) Перемножением ведущих элементов метода Гаусса найдите де- 
терминант матрицы коэффициентов данной системы. 


В) Выполните задания А, Б, имитируя работу модельного компью- 
тера, в котором под запись мантиссы числа в режиме с плавающей запя- 
той выделяется три десятичных разряда. 

Проделайте то же, проводя частичное упорядочивание по столбцам. 

Сравните результаты В с результатами А и Б. 


Г) Подсчитав невязки приближенных решений данной системы, по- 
лученных в задании В, произведите итерационное уточнение этих реше- 
ний в той же вычислительной среде (см. $ 2.8.1). 


2.2. А) Выполните [О-разложение матрицы 


4 -32 
А=| 8 -8 7 
12—55 


по формулам (2.9)-(2.10) и найдите решение системы Ах=Ь, где 
Ь= (0;—12; 4)Г. 
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Б) Используя 1/О-разложение, полученное в задании А, найдите мат- 
рину д двумя способами: решая подсистемы Ах; =е;, где х; ие; — 


столбцы соответственно искомой и единичной матриц, и реализуя вычис- 
ления по формулам (2.15)—(2.17). 


2.3. А) Методом квадратных корней решите систему 


16х| — 8х> —4х3 = -8, 
—8х1 + 13х› -4хз -Зх4д = 7, 
—4х1 - 4х2 +9%3 = 6, 

— 3% +3х4д = -3. 


Б) С помощью полученного в А) 070 -разложения Холецкого най- 
дите детерминант матрицы коэффициентов данной системы и обратную 
ей матрицу. 

В) Подсчитав число обусловленности, выясните, какую относитель- 
ную погрешность может иметь результат А, если в одной компоненте 
правой части данной системы допустить абсолютную ошибку 0.01. 


2.4. Выведите формулы для вычисления элементов матрицы А-1, 


обратной к симметричной матрице А, на основе И’ О-разложения (по- 
добные формулам (2.15)-—(2.17)). Используйте их для обращения матрицы 


41-2 
18 3 
—2:3 10 


2.5. Ограничиваясь трехмерным случаем, покажите, что веществен- 
ная симметричная матрица А может быть представлена в виде произве- 


дения ОГО трех вещественных матриц, где Ф — некоторая верхняя 
треугольная матрица, а 9 — диагональная матрица с элементами диаго- 
нали +1 или -1. 
Примените полученный результат к системе 
Хх +2х2 + 3х3 = -3, 
2х +х› + 4х3 = -_5, 


3х + 4х2 +%3 = 


2.6. Установите, при каких ие М можно гарантировать коррект- 
ность и устойчивость метода прогонки для решения системы (2.21), где: 


В; =1+7 при 1=2, 3, Й ‚п; 
с:=15+7 при1=.2,й ‚п; 
а =— при 1=1, 2,й ‚п-1? 
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2.7. Выведите формулы левой прогонки для решения системы 
(2.21) (т.е. такие, при которых неизвестные х; вычислялись бы в порядке 


возрастания индексов). 
Решите систему предыдущего упражнения при и=7, г; =Й +1411 
(где 1=1,й ‚6), г7 = 202 по формулам левой и правой прогонок. 


2.8. Пусть в (2.21) Ь;.| =а; при всех 1=1, 2, й ‚, и-1. Запишите для 
этого случая расчетные формулы метода квадратных корней. Подсчитайте 
число требуемых арифметических операций и сравните его с аналогичным 
результатом для метода прогонки (см. $ 2.8.2). 


2.9. Решите систему из упр. 2.1 методом вращений: 

а) используя всю разрядную сетку калькулятора или компьютера; 

6) работая, как и в упр. 2.1В, с тремя значащими цифрами. 
Проанализируйте результаты, сравнивая их с результатами упражнений 
2.1А и 2.1В. 
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ГЛАВА 3 |ИТЕРАЦИОННЫЕ МЕТОДЫ 
РЕШЕНИЯ ЛИНЕИНЫХ 
АЛГЕБРАИЧЕСКИХ СИСТЕМ 
И ОБРАЩЕНИЯ МАТРИЦ 


Рассматриваются итерационные способы решения систем 
линейных алгебраических уравнений и обращения матриц, слу- 
жащие серьезной альтернативой прямым методам решения та- 
ких задач, по крайней мере в случаях, когда их размерность вели- 
ка. Показывается логика построения нескольких наиболее важ- 
ных итерационных процессов, таких как методы простых 
итераций, Якоби, Зейделя, релаксации, Шульца, и изучаются 
условия сходимости последовательностей приближений, полу 
чаемых этими методами, к искомым решениям. Дается первое 
представление о методах установления. Приводится алгоритм 
метода сопряженных градиентов и объясняется суть метода 
минимальных невязок. 


8$ 3.1. РРШЕНИЕ СЛАУ МЕТОДОМ ПРОСТЫХ 


ИТЕРАЦИИ 
Система стандартного вида 
Ах-Ь, (3.1) 
где А=(@ у) — ихи-матрица а х=(ху,й А и 
ь=(,й ‚,Б,)’ — п-мерные векторы-столбцы, тем или иным 


способом (таких способов существует бесконечное множество; 
некоторые из них будут рассмотрены ниже) может быть преобра- 
зована к эквивалентной ей системе вида 


х = Вх-+с, (3.2) 


где х — тот же вектор неизвестных, а В и с — некоторые новые 
матрица и вектор соответственно. Систему (3.2) можно тракто- 
вать как задачу о неподвижной точке линейного отображения В 


в пространстве А,„ и по аналогии со скалярным случаем (более 
подробно изучаемым в гл.6) определить последовательность 
(к) ы 


приближений х к неподвижной точке х рекуррентным ра- 


венством 
х (ЕН) — вх +е, К=012В. (3.3) 
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Итерационный процесс (3.3), начинающийся с некоторого 


Г 
вектора х( = (©), ‚х©)) ‚ будем называть методом про- 
стых итераций (коротко МПИ). 

Изучим комплекс вопросов о сходимости этого процесса. А 
именно: 1) какие нужно предъявить требования к В, сих’, 
чтобы последовательность («“ ›) при К —> © имела пределом х 
— неподвижную точку задачи (3.2) (и значит, решение эквива- 
лентной (3.2) исходной системы (3.1))? 2) с какой скоростью схо- 
дится этот процесс, т.е. каков закон убывания абсолютных по- 
грешностей получаемых по формуле (3.3) приближений? 
3) сколько нужно сделать итераций по там (3.3), чтобы при 
заданном начальном приближении х`’’ найти решение задачи 
(3.2) с заданной точностью? 

Ответы на подобные вопросы теории итерационных мето- 
дов в К„ часто опираются на следующие два утверждения о схо- 


димости степенных матричных рядов, точнее, «матричной гео- 
метрической прогрессии». Во втором из них, а также всюду далее 
под нормой матрицы понимается мультипликативная норма та- 
кая, что |Е] =1 (Е — единичная матрица). 


* 

Лемма 3.1 . Условие, что все собственные числа 
матрицы В по модулю меньше 1, является необходимым и 
достаточным для того, чтобы: 


1) В > О ири К (ЕЕМ): 
2) матрица Е-В имела обратную и 


(Е-В)! =Е+В+В2 +й +ВА+й 
Лемма 3.2“”). Если [В <а<1, то матрица Е-В име- 


К] | 
ет обратную матрицу (Е-В)! = УВ и при этом спра- 


А=0 
ведливо неравенство 


* 
в некоторых литературных источниках лемма 3.1 называется 
леммой Неймана (см., например, [139]). 


#* 

в функциональном анализе для более общего случая, когда В — 
линейный оператор, действующий в полных нормированных пространст- 
вах, эту лемму называют теоремой Банаха ([80] и др.). 
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Доказательство. Рассмотрим матричный ряд 


Е+В+В2+й +В +й (3.4) 
В силу условия леммы и вытекающего из мультипликативного 
свойства нормы неравенства [в | <|в{^, этот ряд можно прома- 
жорировать сходящимся числовым рядом: 


перер [2] «вел окача?ча чай Г 
а 
Следовательно, ряд (3.4) сходится, т.е. существует матрица 


У=Е+В+В2 +йЙ +В^ +й 


такая, что |У| <=— Так как 


(Е-В)У =(Е-В)Е+В+В2 +й +В +й )= 
=Е+В+В2+й +В + -В-В2 -ВЗ-Й ВАНЯ =Е, 
то У=(Е-В) '. Лемма доказана. 


Доказательство леммы 1 более сложно. Его можно найти во 
многих учебных пособиях по вычислительной математике и по 
функциональному анализу (см., например, [20, 61, 80, 99, 139]). 


Теорема 3.1. Необходимым и достаточным условием 
сходимости метода простых итераций (3.3) при любом на- 
* 

чальном векторе х ох решению х системы (3.2) является 
требование, чтобы все собственные числа матрицы В бы- 

ли по модулю меньше 1. 
Доказательство. Достаточность. Пусть тах|Ав|<1, 
тогда по лемме 3.1 общий член В^ ряда (3.4) стремится к нуль- 
матрице и существует матрица (Е-В)', являющаяся пределом 


частичных сумм (Е +В+ В +В +В^ ) при К —> ©. Применяя ре- 
курсию в равенстве (3.3), определяющем МПИ, получим: 


ХСН — Вх) +е=в2х(О + (В+Е)с=Й = 
= вх (Е +в+в2 +й +В фе. (3.5) 
В силу сказанного выше, предел последнего выражения сущест- 


вует при любом фиксированном х(0) и равен (ЕВ) "с. Следо- 
вательно, итерационный процесс (3.3) сходится и 


93 


х* = Нтх(®9 =(Е-В) "с 
Ао 


Подставляя х’в уравнение (3.2), преобразованное к виду 
(Е -В)х=с, имеем: 


(Е-В)(Е-В) 'с=с, 


* . К 
т.е. вектор х = Им х(Ю удовлетворяет системе (3.2). (Заметим, 
К—>оо 
* 
что это х — единственное решение (3. 2). Действительно, допус- 


тив, что наряду с х’ таким, что х = Вх. „+, имеется х ‚ удов- 
летворяющее такому же равенству х“ =Вх” +с, получаем 
хх“ = Вх —х ]. Последнее означает, что число А =1 по оп- 
ределению является собственным значением матрицы В, что 
противоречит условию). 

Необходимость. Как видно из представления общего члена 
итерационной последовательности (о ) в форме (3.5), сущест- 


. _@+ (0) 
вование Шт х при любых векторах х`’ ис (в том числе и 
Ао 
нулевых, что гарантирует существование предела каждого сла- 


гаемого в правой части (3.5)) влечет сходимость матриц В к 


[2.9] 

нуль-матрице и сходимость ряда У в^ к (Е-В)'. Согласно 
К=0 

лемме 3.1, это равносильно выполнению условия |Йв|<1 для ка- 


ждого собственного числа матрицы В. 
Теорема доказана. 


Теорема 3.2. Пусть |В|<а<1. Тогда при любом на- 


чальном векторе х 9 МПИ (3.3) сходится к единственному 


® 
решению х задачи (3.2) и при всех КЕМ справедливы 
оценки погрешности: 


1) |®" ви | (апостериорная); 


2) |" - Е — О Ш ки (априорная). *) 


* 

) Лат. а рот и а роментот означают соответственно «до опыта» и 
«из опыта», т.е. априорной оценкой можно воспользоваться до начала сче- 
та, а апостериорной — лишь после проведения (-й итерации. 


94 


(Одно и то же обозначение ||| здесь используется для мат- 
ричных и векторных норм, согласованных между собой, т.е. 
таких, что ||Ах|<|А|-[х|). 


Доказательство. Вычитая из равенства (3.3) равенство 
х(® = вх +с, имеем х(+О — х® = в(х< - х(- о). Перехо- 
дя в последнем к нормам, получаем неравенство 


| |< 4х х1|, (3.6) 


из которого видно, в силу условия 4 <1, что элементы итераци- 
С К 
онной последовательности (к ›) сближаются с ростом номера 
К. С помощью (3.6) оценим разность между (&+т)-м и К-м чле- 
нами этой последовательности при некотором те М: 


т кб к) хто хи хинт) + 
х(&+т-2) т _ х@+) 4х (+0 -х@ |< 
<? -х +2) хе + +” хит < 
< 4х) 5х0]? | хе] +й +4” =] = 
41-4” й 
рая А-а") 
Рассматривая итоговое неравенство при А —> © и фиксированном 


Г И 
т, видим, что (‹ > ) является фундаментальной 


последовательностью и, в силу полноты пространства В,, имеет 


5 @- |< 


5) =] 


ЕЗ 
предел. Обозначим его х. Переходя к пределу в равенстве (3.3), 


получаем равенство х’= Вх” +с, означающее, что х" = Ни х(9 
ы А—>о 

— решение уравнения (3.2). При этом х — единственное 
решение (3. 2), так как предположив существование другого 
решения хех и нормируя равенство х -х“ ЕВС бы 
приходим к противоречащему условию теоремы неравенству 
[В] >1. 

Справедливость утверждаемых в теореме оценок по- 
грешности видна из неравенств 


И В 
1-4 1-а 
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если в них теперь зафиксировать К и перейти к пределу при 
т —> ©. Теорема доказана. 


Замечание 3.1. Последние неравенства говорят еще о том, что ап- 
риорная оценка, как правило, грубее апостериорной. 


Замечание 3.2. Теорема 3.2 могла быть доказана на основе лем- 
мы 3.2 и теоремы 3.1. В частности, сходимость последовательности (©) 


* 
к решению х системы (3.2) сразу следует из теоремы 3.1, в силу соотно- 
шений |Яв|<||В] <1. Из леммы 3.2 также легко вывести другую априорную 
оценку погрешности А-го приближения: вычитая из равенства 


х’=(Е-В) 'с=(Е+В+й +В“ +1 )с 
равенство 
х(®) = вх © + (Ева +в 
(см. (3.5)), имеем: 
| -х® |= [(в^ +В +1 )е-в^х®)|< 


«рее 


Замечание 3.3. Априорная оценка позволяет подсчитывать заранее 
* 


число итераций А, достаточное для получения решения х с заданной 
точностью = (в смысле допустимого Ри абсолютных погрешностей) 
0 


при выбранном начальном векторе х( 6 Для этого нужно найти наимень- 
шее целое решение неравенства 


5 


[с 


относительно переменной А (или неравенства око ЗЕ в с0- 
—4 
ответствии с результатом предыдущего замечания). Апостериорной же 
оценкой удобно пользоваться непосредственно в процессе вычислений и 
останавливать этот процесс, как только выполнится неравенство 


С 1- 
ха 3] “а. 
Ч 
Отметим, что неравенство | = <= будет гарантией выполнения 
* 1 
неравенства | —х® |<= только в том случае, когда 4 “= 


Замечание 3.4. По поводу выбора начального приближения. 
Как установлено выше, сходимость МПИ (3.3) при условии [Яв|<1 
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гарантируется прилюбом начальном векторе х (0). Очевидно, итераций 
потребуется тем меньше, чем ближе х(0) кх”. Если нет никакой дополни- 
тельной информации о решении задачи (3.2) (например, может быть из- 
вестным решение близкой задачи или грубое решение данной задачи), за 
х(0) обычно принимают вектор с свободных членов системы (3.2). Моти- 
вация этого может быть такой: матрица В «мала», значит вектор Вх 
* 
«мал», нии и вектор х не должен сильно отличаться от векто- 


ра с. При выборе х(0) с фигурирующая в теореме 3.2 априорная оценка 
принимает вид 


х кан УКЕМ. 
Ч 


Пример 3.1. Для системы 
1.1х; — 0.2х> + 0.1хз =1.6, 
0.1% —1.2х2 — 0.2х3 =2.3, 
0.2х1 — 0.1х2 +1.1х3 =1.5 


записать какой-нибудь сходящийся процесс простых итераций. За сколько 
шагов этого процесса, начатого с нуль-вектора, можно гарантированно 
достичь точности = = 0.001 по норме-максимум? Найти третье приближе- 
ние, оценить его абсолютную погрешность и сравнить ее с истинной по- 
грешностью, зная точное решение системы х” = (1;—2; 17 $ 


Учитывая очевидную близость матрицы данной системы к единич- 
ной матрице, вычленим единицы из диагональных элементов, в результате 
чего система преобразуется к виду 


х =-0.1х: + 0.2х› — 0.1х; +1.6, 
Хх =0.1х1 — 0.2х› — 0.2х3 — 2.3, 
хз =-0.2х; + 0.1х> - 0.1х; +1.5. 


Эта система равносильна исходной и имеет форму уравнения (3.2), в ко- 
тором можно считать 


—01 0.2 —01 1.6 
В= 0.1 —0.2 —02|], е=|-23 
—0.2 0.1 —0.1 1.5 


Так как |В|.. =0.5 (=4) <1, можно воспользоваться теоремой 3.2. Со- 
гласно ей, метод простых итераций 


ЖЕН) = 0.10 +.0.2х 9 — 0.1% +1.6, 
хН) = 0.1 —0.2х® —0.2х® —23, 


Жо =-0.2х0 +0.1х® — 0.10) +1.5 
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(где Х=0,1,2,й ) определяет сходящуюся к решению х” последователь- 
т 

ность векторов х(0 = (< : х®) ; х®) ‚ априорная оценка погрешностей 

которых есть 


кк | «05° | к — к 
[* ©) 


1- 0.5 

При заданном векторе х(9) =0 первым приближением х(), очевидно, 

служит вектор с свободных членов и, значит, ВМ -*® | = [и =23. 
[) 


Следовательно, требуемое число итерационных шагов, достаточное 
для достижения точности 0.001, может быть найдено как первое из после- 
довательности натуральных чисел /, удовлетворяющих неравенству 


0.51 .2.3< 0.001, 
т. е. получив отсюда А &12.2, принимаем А =13. 
Вычислим приближения х(2) их; 


х(2) =—0.1-1.6+0.2.(-2.3) — 0.1-1.5+1.6 = 0.83, 
х(2) =0.1.1.6- 0.2. (-2.3)- 0.2-1.5-2.3 =-1.98, 

2) =-0.2.1.6+0.1- (-2.3) — 0.1-1.5+1.5=0.8; 
х(3) =—0.1.0.83+0.2. (-1.98)- 0.1-0.8+1.6 =1.041, 
х( =0.1.0.83- 0.2. (-1.98)- 0.2.0.8 2.3 =-1.981, 
х) =-0.2.0.83+0.1. (-1.98) — 0.1-0.8+1.5=1.056. 


Априорная оценка Иное третьего приближения дает 


|> -х8]| < .05- | -х®| =0.25.2.3=0.575, 
ры Е 5 х 
в то время как истинная ошибка составляет величину 
_ 0.041 
|>* 8 =|| 0.019 || =0.044, 
” 0.044 


[) 


что на порядок лучше прогнозируемой ошибки. Это говорит о том, что 
найденное выше априорное число итерационных шагов наверняка больше 
необходимого (оценка есть оценка!). Если воспользоваться апостериорной 


оценкой погрешности, то для того же приближения х(3) получим 
0.211 

=] = || 0.001 || =0.256 
0.256 


ее 


[ее] 
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—Щ несколько лучший результат, как и следовало ожидать в соответствии с 
замечанием 3.1. Нетрудно понять, что сравнительная точность апостери- 
орных оценок заметно увеличивается с увеличением номера итерации. 


$ 3.2. МЕТОД ЯКОБИ 


Вернемся к рассмотрению СЛАУ в виде (3.1). После выяс- 
нения условия, которому должна удовлетворять матрица коэф- 
фициентов приведенной системы (3.2) для сходимости МПИ 
(3.3), следует осуществить приведение системы (3.1) к виду (3.2) 
так, чтобы это условие выполнялось. Рассмотрим один из спосо- 
бов такого приведения, достаточно эффективный в определен- 
ных случаях. 

Представим матрицу А системы (3.1) в виде 


А=Гг-+)-+В, 


где В — диагональная, а Г, и В — соответственно левая и пра- 
вая строго треугольные (т.е. с нулевой диагональю) матрицы. То- 
гда система (3.1) может быть записана в виде 


1х+Ох+Вх=Ь, (3.7) 


и если на диагонали исходной матрицы нет нулей, то эквива- 
лентной (3.1) задачей вида (3.2) будет 


х=-0 1(1,+В)х+0-Ъ, (3.8) 
т.е. в равенствах (3.2) и (3.3) следует положить 
В=-02 (+В), с=оЗЬ. 


Основанный на таком приведении системы (3.1) к виду (3.2) ме- 
* 


тод простых итераций (3.3) называют методом Якоби ’. В век- 
торно-матричных обозначениях он определяется формулой 


(+1) = о .+в)х © +0-Ъ, К=0,1,2,й . (3.9) 


Чтобы записать метод Якоби (3.9) решения системы (3.1) в 
развернутом виде, достаточно заметить, что обратной матрицей к 


матрице О = @„). служит диагональная матрица Ю-! с элемен- 


тами диагонали 4;; = Уаз; Поэтому представление (3.8) систе- 
* ; 
) Якоби Карл Густав Якоб (1804—1851) — немецкий математик. 
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мы (3.1), записанной в виде (3.7), равнозначно выражению «диа- 
гональных неизвестных» через остальные: 


м =-(а1охо +а1зхз+й +атх, -Ы )/ат, 
Х2 =-(а>1х1 +а2зхз +й + а2иХи —Р>)/а>>, [Е 10) 


Хп =-(@тх +аи2х> +й + Чи, и Хи -в,) Чйп. 


Теперь для записи итерационного процесса (3.9) осталось в ра- 
венствах системы (3.10) только «навесить» индексы, соответст- 
вующие номерам приближений (т.е. К =0,1,2,й ): 


ЕН) =— а12х(0 +азх® +1 чаих® ант, 
Жо = ар чай ах а», (3.9') 
х (+1 = их +ах® +й +. -Ь Гат. 


Установим простой достаточный признак сходимости мето- 
да Якоби к решению системы (3.1). 


Теорема 3.3. В случае диагонального преобладания в 
матрице А системы (3.1) метод Якоби (3.9) сходится. 


Доказательство. Диагональное преобладание в мат- 
рице А означает, что 


> Ув УЕНЬЙ п. 
(9 


Следовательно, влюбой строке матрииы итерирования (ина- 
че, матрицы перехода) 


с 9“ ВА _ ЧЕ _ ат 
1 а 11 411 
_9271 (0 923 р _ Чи Чи 
В-| ар а22 922 422 310 
Чи. Яя _ Я 5 Чт, п-1 0 
Чтп Я тп Ч тп Чип 
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метода Якоби сумма модулей элементов меньше единицы. 
Значит, по крайней мере, одна из норм матрицы В (согласован- 
ная, в частности, с векторной нормой-максимум) меньше едини- 
цы. Таким образом, существуют нормы, в которых к методу Яко- 
би, рассматриваемому как метод простых итераций, применима 
теорема 3.2, т.е. метод Якоби сходится. Так как сходимость по 
одной норме в пространстве В,„ означает сходимость по любой 


другой, тем самым теорема 3.3 доказана. 


Замечание 3.5. Обратим внимание на то, что к методу Якоби при 
условии диагонального преобладания в матрице А относится полностью 
заключение теоремы 3.2, а также предыдущие замечания; нужно лишь 
учесть в них, что матрица В определяется с помощью (3.11), а вектор с 


— равенством 
Т 
ы Ь> Ь 
с 84 
11 922 Я тп 
При этом матрица Ю в представлении системы (3.7) заведомо обратима. 


Следствием теоремы 1, устанавливающим необходимые и 
достаточные условия сходимости метода Якоби, является сле- 
дующая теорема. 


Теорема 3.4. Метод Якоби (3.9) сходится к решению 
системы (3.1) в том и только в том случае, когда все корни 
‘уравнения 


а ар й ат 
а2л1 а20й а2п 5 

Чт Чи2 й ай 
по модулю меньше единицы. 


Действительно, чтобы все собственные числа матрицы 


В=-р '(,+В) были по модулю меньше единицы, как этого 
требует теорема 3.1 для данного случая, нужно, чтобы меньше 
единицы были модули всех корней характеристического уравне- 
ния 


че (-о- +в) -ЯЕ)= 0. 
Последнее же эквивалентно уравнению 
д4е(г+В+70)=0, 


которое в записи через элементы исходной матрицы А и фигу- 
рирует в формулировке теоремы. 
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$ 3.3. МЕТОД ЗЕЙДЕЛЯ 


Под методом Зейделя ) обычно понимается такое видоиз- 
менение метода простых итераций (3.3) решения СЛАУ, приве- 
денных к виду (3.2), при котором для подсчета 1-й компоненты 
(К +1)-го приближения к искомому вектору х используются уже 
найденные на этом, т.е. (к+1)-м шаге, новые значения первых 
1-1 компонент. Это означает, что если система (3.1) тем или 
иным способом сведена к системе (3.2) с матрицей коэффициен- 


тов в=(, и вектором свободных членов с=(с;)" |, то 


1 
приближения к ее решению по методу Зейделя определяются 
системой равенств 


хи) = [2 29 +6200 +й +6, +1 ) 


К К 2 | 
С т (3.12) 


х (+) = вых) + Вх +й +60 +5 


где К=0,1,2,й , ах 


начального вектора х ©). 

Применительно к компьютерным расчетам один полный, 
т.е. векторный итерационный шаг метода Зейделя может интер- 
претироваться как реализация формулы (3.2), где под знаком ра- 
венства следует понимать знак присваивания, а под х — один и 
тот же линейный массив из и элементов, на нулевом шаге запол- 
ненный компонентами заданного начального вектора х °). В та- 
ком случае на обычной однопроцессорной вычислительной ма- 
шине элементы массива х будут постепенно замещаться новыми 
элементами. 

Аналогичный взгляд на МПИ (3.3) показывает, что для 
компьютерной реализации одного его шага нужно целиком со- 
хранять и-элементный массив х, подставляемый в правую часть, 
до тех пор, пока не сформируется полностью другой 
п-элементный массив — результат данного итерационного шага. 
В связи с такой интерпретацией метод Зейделя называют мето- 
дом последовательных смещений, а метод простых итераций — 
одновременных смещений. 


— компоненты заданного (выбранного) 


* Е 
) Зейдель Филипп Людвиг (1821—1896) — немецкий астроном и 
математик. 
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Пример 3.2. Возьмем за основу расчетные формулы МПИ, запи- 
санные в примере 3.1 для заданной там системы, и в соответствии с (3.12) 
преобразуем их в расчетные формулы метода Зейделя: 


Же) = 0450 +0250 01х00 +156, 
хе = олх 0.2% —0.2х® 23, 
ХО = 0.200 +040 0х +15. 


Начиная процесс вычислений с того же начального приближения х0) = 0, 
далее при А =0,1,2 последовательно получаем: 


х(0 =0.1.1.6-2.3 =-2.14, 
х(0 = —0.2-1.6+0.1-(=2.14)+1.5 = 0.966; 


х) = —0.1.16 +022. (-2.14) —0.1.0.966 +1.6 = 0.915, 
х() = 0.1.0.915 —0.2-(-2.14) -0.2.0.966 2.3 = —1.974, 
х(2) = 0.2.0.915 +0.1.(-1.974) —0.1-0.966 +1.5 = 1.023; 
хб) = 0.1.0.915 +0.2.(-1.974) —0.1-1.023 +1.6 = 1.01, 
х® = 0.1.1.011 -0.2.(-1.974) -0.2-1.023 —2.3 = -2.009, 
х®) = —0.2.1.011 +0.1. (-2.009) — 0.1.1.023 +1.5 = 0.995. 


Вектор ошибок третьего приближения х(3) по методу Зейделя к точному 


* 
решению х” = (1; -2; 1)” данной в примере 3.1 линейной системы есть 


(- 0.011; 0.009; 0.005)". Его норма-максимум составляет величину 0.011, 
что в 4 раза меньше, чем при применении в тех же условиях метода про- 
стых итераций. Поскольку показанное улучшение не требует дополни- 
тельных вычислений, налицо эффективность подобной модификации 
МПИ и целесообразность ее дальнейшего изучения. 


Остановимся подробнее на случае, когда приведение систе- 
мы (3.1) к виду (3.2) основано на представлении (3.7), т.е. когда 
метод Зейделя есть модификация метода Якоби. Запись соответ- 
ствующих расчетных формул здесь сводится к верхней 
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индексации системы (3.10) по типу (3.12): 
+) [а ох 9 +азх® ) +1 +аих@ Ю Ву 


(+1) _ (+1) (К) 
х =-— (ах + а23хз о +Й +а х —Б й 
2 21] 23 2п Ув /а 922 (3.13) 


(+1) =- (их ах +й +4, р” -Ь ат, 


Г 
где в =0,1,2,й ; х(0) = (:®, й ‚хо задается. 

Для анализа сходимости метода Зейделя (3.13) обратимся к 
его векторно-матричной форме. Легко видеть, что если неявный 
вид метода Якоби, вытекающий из представления (3.7) системы 
(3.1), есть 


1х) + 0х1 + вх) =Ь (ср. с (3.9)), 


то равнозначный (3.13) неявный вид метода Зейделя в векторно- 
матричных обозначениях суть 


1х(+0 + рх +0 + вх -Ь 


Следовательно, тот же вектор х +0, который фигурирует в ле- 
вой части совокупности равенств (3.13), может быть получен по 


формуле 
х(+1) = (1,+ р) вх + (1,+ 0). (3.14) 


Последнее выражение определяет не что иное, как МПИ (3.3) для 
системы вида (3.2), где 


В=-(Г+0)'В, с=(@+0)ЪЪ, 


т.е. результат применения одного шага метода Зейделя (3.13), 
полученного на основе (+0+В)-разложения матрицы А, 
можно расценивать как шаг МПИ для эквивалентной (3.1) задачи 
о неподвижной точке 


х=-(1,+0) 'Вх+(1.+0)1Ъ (3.15) 


(разумеется, если треугольная матрица №+Ю обратима). Эта 
связь между методом Зейделя и методом простых итераций по- 
зволяет легко переформулировать некоторые утверждения о схо- 
димости МПИ применительно к методу Зейделя (3.13). 
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Теорема 3.5. Для сходимости метода Зейделя (3.13) 
необходимо и достаточно, чтобы все корни уравнения 


а14 ар й ат 
217, а227 й аи 22 [© 16) 
ата а,24й атА 

были по модулю меньше единицы. 


Доказательство. Применяя теорему 3.1 к МПИ (3.14), 
составляем характеристическое уравнение, определяющее собст- 


венные числа А матрицы В =-([+ р)! В: 
де (Г, + р)! ®-лЕ)= 0. 
Это уравнение равносильно уравнению 
4е((.+0)1+В)=0, 
которое с учетом представления А =[ +0 +В совпадает с (3.16). 
Замечание 3.6. Уравнение (3.16), а также метод (3.13), являющийся 
частным случаем более общей формы метода Зейделя (3.12), называют 


иногда соответственно уравнением и методом Некрасова [180]. Ме- 
тод (3.12) называют еще и методом Гаусса-Зейделя [138, 139]. 


Прямым следствием теоремы 3.2 для метода Зейделя (3.13) 
является следующая теорема. 
Теорема 3.6. Пусть [+в] <{<1. Тогда при лю- 


бом начальном векторе х(°) метод Зейделя (3.13) сходится 


* 
к решению х системы (3.1) и справедливы оценки погреш- 
ности 


к ее -]. б 


Ясно, что для непосредственного использования оценок 
(3.17) нужно предварительно выполнить обращение треугольной 
матрицы Г/+) и перемножить матрицы (Е.+0) и В. В таком 


случае частично теряется смысл в поэлементной реализации ме- 
тода Зейделя (3.13); вместо этого можно проводить итерации по 
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формуле (3. м тех пор, пока не выполнится условие 


| т °=— а. где => 0 — требуемая точность. В частно- 


сти, такой ад может быть рекомендован при решении СЛАУ 
методом Зейделя на компьютерах с векторной обработкой ин- 
формации. 

Более подходящие для использования оценки погрешности 
метода Зейделя (3.13) можно получить, разлагая матрицу 


В=-0\ (Г.+В) (см. (3.11)) в сумму двух строго треугольных 
матриц, т.е. полагая 


В= В; +Вр 
где 
0 о 0 0 
а оро о 
ты 22 
В ор в р 
_ ат _ Чи р Ч, п-1 0 
Ч тп Чип Ч тп 
0 @12. Г) и Чи 
Ч 1 Ч 1 Ч 1 
А Я 
Вр =| о 0 в — 2, п-1 _ 2п 
а2> а22 
ГАИ ЛОВИТ ( ( 
00 0 0 


С ними эквивалентное (3.1) уравнение (3.2) приобретает вид 
х=В,х+Врх+е, 

т.е. для решения х” будет точным равенство 

х’=Вух’ +Врх” +с, 
а метод Зейделя (3.13) — соответственно 

х(+0 = Вух (0 + Врх(9 + с. 
Из двух последних равенств получаем следующее: 
х*—х (+0 = Ву (х” — х(+0) + Вр(х” _ х(®)). 

Это равенство, записанное в виде 


х*—-х® = В, (х* -х@®))+Вр(х* -х О), (3.18) 
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можно расценивать как точную связь между погрешностями 
К-гои (К -—1)-го приближений в методе Зейделя (3.13). Отсюда, 
переходя к нормам, легко вывести априорную оценку погрешно- 
сти, что можно оформить в виде следующего утверждения. 


ВЕ. 
. 1-|В | 
Зейделя (3.13) определяет сходящуюся последовательность 
9) при любом начальном векторе х(0), и имеет место 
оценка 


Теорема 3.7 [3]. Пусть р <!. Тогда метод 


| 


р. -х® | УкЕМ. 


Как и у предыдущей, у этой теоремы имеются свои недос- 
татки, затрудняющие ее применение: нужно знать меру близости 


* 
начального приближения х(0) к решению х. Ценность ее скорее 
в том, что в ней фигурирует легко вычисляемый коэффициент 
[Вл] 
1-[В»| и у 
шагов, характеризующий быстроту сходимости метода Зейделя 
(3.13). При организации практических вычислений по формулам 
(3.13) целесообразнее ориентироваться на следующий результат. 


связи ошибок результатов двух соседних итерационных 


Теорема 3.8. Пусть |В|<1 (20е В — матрица 
(3.11)). Тогда для определяемой методом Зейделя (3.13) по- 
следовательности приближений справедлива апостериор- 
ная оценка погрешности 


г ее к] УЕеМ. 


Для доказательства этого утверждения  подставим 
В, =В- Вр в равенство (3.18). Имеем 


* 


х* —х(0 = В, (х° ку Вр(х” «И, 
что в условиях теоремы (с учетом леммы 3.2) равносильно равенству 


* 


хх) = (ЕВ) В -х 3). 
Отсюда, переходя к нормам, получаем нужную оценку. 


Из теоремы 3.8 вытекает следующая, более удобная на 
практике, формулировка. 
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Следствие 3.1. Пусть К; — первое из натуральных 


чисел К, с которым при заданном &>0 для генерируемой 
процессом Зейделя (3.13) последовательности векторов 


Г. А 
х(®) = х ) й х(® в некото Л 

Ем ,Й , ж рых согласованных нормах 
выполияется неравенство 


| Не 


* 
Тогда за | о х системы (3.1) может быть при- 


нят вектор х и абсолютная погрешность при этом не 
будет превышать = (в выбранной норме). 


Условия сходимости методов Зейделя и простых итераций, 
вообще говоря, различаются. Но некоторые достаточные условия 
можно применять к обоим методам одновременно. 


Теорема 3.9. Если в матрице А системы (3.1) имеет 
место диагональное преобладание, то метод Зейделя (3.13) 
сходится, причем быстрее, чем метод Якоби (3.9'). 


Доказательство. Вычитая тождественное (3.13) равен- 
ство (3.14) из равенства (3.15), рассматриваемого как верное ра- 
венство при подстановке в него решения х , получаем 

* =: * 
хх = (1+0) В" -х 9). 
Введем в рассмотрение вектор ошибок 
А (®) хх 
* р. 
с компонентами 50 =Х; -х®. Тогда это равенство через эле- 


менты матрицы А исходной системы (3.1) можно записать так 
(см. соответствие между — 14) и (3.13)): 


(+0 1 (+0 1 (К) 
5; == ауд} = У а арб} , 
ай = Чай = 
где 1=12,Йй ‚и; К=0,1,2,й . Переходя к модулям, отсюда 
имеем: 


5+1 < < 5+0 | +. 
АН 


12 Иа [60| < 


пы т Ув. 


«пор 
[| = = 


у 
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Обозначим @; = т 1 и, В; - кр: о) и А“. = тах 
Чт 
(где УЗЫ может трактоваться как а погрешность 


К-го приближения по методу Зейделя и ). В этих обозначениях 
последнее неравенство имеет вид 


Пока] + А]. (3.19) 
[99 со 
Пусть те {1,2,й ‚п} — значение индекса 7/7, при котором 
реализуется равенство = тах [5 =“ . Тогда из 
7 [2] 


(3.19) следует 
| 


кам 
[е. 9] [о] 


й 


т.е. при этом фиксированном {= т выполняется неравенство 
А]. 6.20) 


Так как в условиях диагонального ке Вт справедливо не- 
равенство &;+ В;<1, а это неравенство, в свою очередь, влечет 


неравенство <а;+ р; (проверьте!), причем равенство в по- 


1 

следнем случае имеет место лишь при /=1, то абсолютная по- 
грешность приближений по методу Зейделя (3.13), согласно 
(3.20), убывает со скоростью геометрической прогрессии, знаме- 
натель которой, вообще говоря, меньше, чем для соответствую- 


щего этому случаю метода Якоби (3.9'). Такое мажорирование 


ы (+1) 
последовательности величин |х х 


| позволяет сделать за- 
ключение о справедливости доказываемой теоремы. 


Замечание 3.7. В соответствии с последней теоремой в методе Зей- 
деля (3.13) вместо оценок (3.17), требующих дополнительных затрат на 
обращение треугольной матрицы, допустимо использование оценок 
погрешности метода Якоби. Естественно, они заведомо грубее. 


Ез 
) Индекс оо у знака нормы использован согласно обозначению со- 
ответствующего частного случая /„-нормы (иначе, нормы Гельдера, см. 


приложение 1). 
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Остановимся еще на одном важном для приложений классе 
систем вида (3.1), для которых имеет место сходимость метода 
Зейделя (3.13). 


Определение 3.1 [61]. Система Ах=Ь называется 
нормальной, если матрица А — симметричная положи- 
тельно определенная. 


Теорема 3.10. Если система (3.1) — нормальная, то 
метод Зейделя (3.13) сходится. 


Доказательство этой теоремы заключается в проверке того, 


что положительная определенность матрицы А=Ё+ 2+1/ вле- 
чет выполнимость условия теоремы 3.5 (т.е. собственные числа 


—1 
матрицы -— (Г,+)0) 7 по модулю меньше единицы). Это доказа- 
тельство можно найти, например, в [20, 61]. 
Любая линейная система Ах =Б легко может быть симмет- 


ризована умножением на матрицу АГ. Более того, справедлива 
следующая теорема. 


Теоремы ЗАЛ [61]. Пусть ег А 20. Тогда система 
АГАх=А ТЬ — нормальная. 


Таким образом, если, например, известно, что система (3.1) 
однозначно разрешима, но в ее матрице коэффициентов нет диа- 
гонального презолалания, метод Зейделя типа (3.13) можно при- 


менять к системе АГАх=АТЬ. Правда, при этом возникают 
трудности со своевременным окончанием процесса итерирова- 
ния, обеспечивающим заданную точность приближенного реше- 
ния, так как приведенные ранее оценки погрешности (см. теоре- 
му 3.6 и замечание 3.7) в этом случае «не работают». Да и сходи- 
мость в этом случае может оказаться весьма медленной. 


Наряду с рассмотренными, применяют и другие способы 
приведения систем (3.1) к виду (3.2) для их решения методами 
простых итераций и Зейделя. Достаточно общий подход к этой 
процедуре заключается в том, что эквивалентное (3.1) уравнение 
0=Б-—Ах умножается на некоторую неособенную матрицу Н 
(матричный параметр) и к обеим частям прибавляется вектор х. 
Полученное уравнение 


х=х+Н(Ь- Ах), 


* 
) Переход от системы Ах=Ь к системе АТАх=АТЬ (или в более 
* * с 
общем случаек А Ах=А Ь) называют симметризацией Гаусса. 
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переписанное в виде 
х=(Е-НА)х+НЬ, 


имеет структуру (3.2). Проблема теперь заключается в подборе 
матрицы Н такой, чтобы матрица В =Е-НА обладала нужными 
свойствами для сходимости применяемых методов; 
для некоторых классов матриц А имеются определенные реко- 
мендации [61, 99]. Заметим, что матрица Н может быть как по- 
стоянной (в этом случае говорят о стационарном итерационном 
процессе), так и изменяющейся от шага к шагу. В последнем 
случае данное уравнение Ах =Ъ подменяется последовательно- 
стью эквивалентных ему задач х=Вух+ех, и соответствующий 


итерационный процесс называется нестационарным. 


8 3.4. ПОНЯТИЕ О МЕТОДЕ РЕЛАКСАЦИИ 


В случаях, когда применение оценок погрешностей в мето- 
дах простых итераций и Зейделя невозможно из-за отсутствия 
констант 4 <1 или 1 <1, ограничивающих сверху какие-либо нор- 
мы матрицы итерирования соответствующего метода (см. теоре- 
мы 3.2 и 3.6), эти методы неэффективны и, более того, как будет 
показано в $3.7, малонадежны ввиду медленной сходимости. 
Рассмотрим одно обобщение метода Зейделя, позволяющее ино- 
гда в несколько раз ускорить сходимость итерационной последо- 
вательности. 
Пусть 20 — обозначение 1-й компоненты А-го приближе- 
ния к решению системы (3.1) по методу Зейделя, а обозначение 


х(® будем использовать для 1-й компоненты А-го приближения, 
получаемого новым методом. Этот метод определим равенством 
хе) =х9 +020 -х(® } (3.21) 


7 7 


ь 0 
ДЕ =Ь 2 й и: Е=0, 12; х( ее задаваемые начальные значе- 
ния; @ — числовой параметр, который называют параметром 
релаксации. Очевидно, при @ =1 метод (3.21), называемый ме- 


тодом релаксации (ослабления), совпадает с методом Зейделя ). 

Конкретизируем метод релаксации для случая, когда исход- 
ная система (3.1) представляется в виде (3.7) и, следовательно, 
метод Зейделя имеет вид (3.13). 


* 
) Метод Зейделя в качестве представителя семейства релаксацион- 
ных методов называют иногда методом полной релаксации. 


| 


Пользуясь введенными здесь обозначениями, запишем на 
основе (3.13) дополнительное к (3.21) равенство для выражения 


(К) 


А т 
компонент векторов # =( у через компоненты векторов 


и 


2 = Щь- ха хе У арх ой (3.22) 


ап = 


Таким образом, метод релаксации можно понимать как пооче- 
редное и формул (3.22) и (3.21) при каждом 
К=0,1,2,й . Действительно, задав начальные значения 
хх (0) И ‚х(0) 


ВЫЧ ты 


и параметр @, при А =0, полагая 1=1,2,й ‚пи, 


20, х0; 20, 0; п 


1 и. 
‚0, (9, 


ИЕ 
при А =1, так же полагая 1=1,2,й ‚и, находим 
2 2). 2 2). . 2 2 
2 Л ), 2. к ) й; 2( ), кб ) 
и т.д. Но можно избавиться от вспомогательной последователь- 


ности („“)), подставив (3.22) в (3.21). Для 1=1,2,й ‚и будем 
иметь: 


1 п 
пало [в За Хх |. 623) 
11 


От формулы (3.23), объединяющей формулы (3.22) и (3.21) 
и пригодной для проведения покоординатных вычислений, мало 
отличающихся от вычислений по методу Зейделя, легко перейти 
к векторно-матричной записи процесса релаксации. С этой целью 
перепишем (3.23) в виде 


т 
ах ХО оба, , к ы (1-в)ах 9-ю У а, х® +0, 
= Л=Н 


И далее, учитывая аддитивное представление матрицы 
А =Г.-+)О-В, получаем векторно-матричный итерационный про- 
цесс в неявной форме 


(р+от.)х (+0 = (1-0)0х® -овх +0. 
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Умножив последнее равенство слева на матрицу (р+@г)", 
приходим к эквивалентному (3.23) методу простых итераций 


хи = (+) ((-о-ов)х 9 +0(+ФЕ) И (3.24) 


(подстановка сюда значения @=1 превращает (3.24) в МПИ 
(3.14), эквивалентный методу Зейделя (3.13)). 

Представление метода релаксации (3.23) в виде (3.24) по- 
зволяет сделать для него некоторые утверждения о сходимости, 
на основании соответствующих теорем о сходимости МПИ. На- 
пример, можно применить теоремы 3.1 и 3.2, полагая в них 
В=(р+01) (((-6)9-@8В), правда, получаемые при этом ре- 
зультаты вряд ли будут вызывать интерес. Более глубокие ре- 
зультаты на этом пути получают, изучая спектральные свойства 
таких матриц В. Так, установлено, что для сходимости процесса 
(3.23) необходимо, чтобы @еЕ (0,2). Для некоторых классов 
СЛАУ (3.1) это требование к параметру релаксации является и 
достаточным. Справедлива следующая теорема, обобщающая 
теорему 3.8. 


Теорема 3.12. (Островского-Рейча, [138, 61]). Для 
нормальной системы Ах=Ъ метод релаксации (3.23) схо- 


дится при любом х® и любом в Е (0, 2). 


Поскольку итерационный процесс (3.23) содержит пара- 
метр, естественно распорядиться им так, чтобы сходимость по- 
следовательности х(®) была наиболее быстрой. Очевидно, это 
достигается в том случае, когда спектральный радиус матрицы 


В =(О+ег)" ((1-@)0-@8В) будет минимальным. В общем слу- 
чае задача нахождения оптимального значения @ =@0 не реше- 
на, и в практических расчетах применяют метод проб и ошибок. 
Однако для отдельных важных классов задач такие значения 
удается выразить через собственные числа матрицы р 1(Г.+В) 
(т.е. корни уравнения, фигурирующего в теореме 3.4) и даже 
оценить ускорение, достигаемое введением в процесс Зейделя 
оптимального параметра релаксации. Существенно отметить, что 
это оптимальное значение @ (Е (1, 2). При значениях @Е (1, 2) 
метод (3.23) называют методом последовательной верхней ре- 
лаксации (сокращенно ПВР- или ЗОВ-методом ). Ввиду низкой 
эффективности метода (3.23) при @Е (0, 1), называемого в этом 
случае методом нижней релаксации, название «метод ПВР» в 
последнее время относят ко всему семейству методов (3.23), т.е. 


* 
) От англ. биссезяте оуег ге[ахайоп. 
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для любых @Е (0,2). При этом случай @=(1 2) называют 
сверхрелаксацией. 

Покажем возможный выигрыш при использовании метода 
ПВР на простейшем примере. 


Пример 3.3. Для системы 


2х1 +хХ2 = 
х +2хр =-1 


2.1 
с симметричной положительно определенной матрицей А -(. 2 и оче- 


* 
видным решением х -[ выполним по три итерационных шага, начи- 


ная с х(0) = 0, методами Якоби, Зейделя и ПВР соответственно по форму- 
лам 


ХО = 0.5509 +05, [000.550 +05, 


Жо = 0.509 0.5, [хе =-0.5х 0 0.5 


при @ =1.1 


Сравнительные результаты третьего шага представлены следующей таб- 
лицей. 


Таблица 3.1 


Метод Якоби | Метод Зейделя Метод ПВР 
(с@=1.1) 


х 0.875 
х) —0.875 
Е ОЕ ЕСИ МОБОВ 


Значение параметра релаксации @ здесь взято близким к оптималь- 
ному, которое для матриц «упорядоченных согласовано со свойством А» 
[27, 138] находится по формуле 


2 


опт == =, 
1+ — р2(В) 
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где р(В) — спектральный радиус матрицы В=р-' (1, +В) (в данном 


) Р(В)= 0.5, @от = 1.0718). 


0 
случае В = 
0.5 0 


$ 3.5. О ДРУГИХ ИТЕРАЦИОННЫХ МЕТОДАХ 
РЕШЕНИЯ СЛАУ 


В основе построения и изучения или, по крайней мере, по- 
нимания многих итерационных методов лежит связь между сис- 
темами алгебраических уравнений и методами дискретизации 
дифференциальных уравнений, их порождающими. 

В простейшем абстрактном, но далеко не самом общем слу- 
чае, легко установить такую связь между СЛАУ (3.1) и абстракт- 
ным дифференциальным уравнением 


9 + АУ =Ь (3.25) 
[1 
с начальным условием у(0) = х(0) ‚ где { — абстрактная скалярная 
переменная, изменяющаяся на промежутке [0, + <), а матрица А 
и вектор Ь те же, что и в уравнении (3.1). 

Пусть постоянный вектор х и переменный вектор у = (г) 
— решения задач (3.1) и (3.25) соответственно. Введем вектор 


2(1):=х-У(0. 
ау 


С 
Учитывая равенство Е из совместного рассмотрения 
[1 [2 


(3.1) и (3.25) выясняем, что 2(Г) удовлетворяет однородному 
дифференциальному уравнению 


СЕ 
— =-А2(( 
= 2(1) 


с начальным условием #2(0) = хх‘). Решением этой начальной 
задачи служит вектор 


2()=е А! .2(0), 


и если спектр А лежит в правой полуплоскости (в частности, ес- 
ли, например, матрица А положительно определена), то 
*()——>0 при любых 12(0). Таким образом, решение х систе- 


мы (3.1) (стационарной задачи) может быть получено как предел 
при {— решения у(гГ) задачи Коши (3.25) (эволюционной 
задачи) с произвольным начальным вектором х(0). 
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Методы приближенного решения стационарных задач, ос- 
нованные на нахождении решений нестационарных задач, асим- 
птотически эквивалентных данным задачам, для достаточно 
больших значений искусственной скалярной переменной, назы- 


* 
ваются методами установления л 


Будем далее считать параметром скалярную величину ть, 
которую применительно к задаче (3.25) можно интерпретировать 
как шаг (вообще говоря, переменный), с которым на полуоси 
[0, +) фиксируются точки 


ю(=0), Я 9 й , 


т.е. = +т,гдейк=0,1,2,й. 
При «замораживании» {=(;, уравнение (3.25) принимает 
вид 


ау 


= = -Ау(,)+Ь. (3.26) 


258. 


Для производной в его левой части при малых т; на основе оп- 
ределения можно записать приближенное равенство 
и — рт Ут) Ук) У@)-У@ь) 
Аа 
К 


т,—>0 ть т 


Теперь ясно, что полагая х(#) =У(,) (заметим, что 


У(10)=у(0) = х(0)), равенство (3.26) можно приближенно заме- 
нить равенством 


(К) 


(А+ _ 
- = Ах +, (3.27) 


х 


ТА 


*) Иногда к дифференциальным уравнениям переходят не от исход- 
ной стационарной задачи, а от какого-то конкретного итерационного ме- 
тода ее решения. Получающуюся при этом асимптотически эквивалент- 
ную дифференциальную задачу называют непрерывным аналогом соот- 
ветствующего итерационного метода (см., например, [36, 48]). 
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которое можно рассматривать как некий явный итерационный 
* 


процесс. Его называют двухслойным ) итерационным методом 
[161] или методом Ричардсона [158]. 

Более общий вид семейство двухслойных итерационных ме- 
тодов примет, если ввести в (3.27) невырожденный матричный 
параметр Ву: 

(А+О (К) 
В“ = _Ах® +Ь. (3.28) 
Тк 

Различные конкретные итерационные процессы решения СЛАУ 
(3.1) (в том числе и все рассмотренные выше) получаются из 
(3.28) фиксированием матриц Ву; и скаляров ту. При этом, если 
В; и гк не зависят от К, т.е. одни и те же на каждой итерации, то 
(3.28) определяет стационарный метод, в противном случае — 
нестационарный. В общем случае, за исключением Ву =Е, 
(3.28) — неявный метод. 

Выбор параметров Вх, тх в (3.28) осуществляют, добиваясь 
удовлетворения каких-то отдельных или совокупности несколь- 
ких, возможно в чем-то противоречивых требований таких, как 
простота, хорошая структура и легкая обращаемость матриц Ву, 
и в то же время, как можно более быстрая сходимость последо- 


* 
вательности («® к решению х системы (3.1). Разумеется, оп- 


тимальность или, скорее, квазиоптимальность некоторых мето- 
дов рассматриваемого семейства удается установить лишь при 
очень жестких ограничениях на решаемую систему (3.1). 

Так, например, доказано [158, 161], что если система (3.1) 
— нормальная с известными границами Яши >0, Яшах > 0 спек- 
тра ее матрицы коэффициентов, то при заранее зафиксированном 
(максимальном в реализуемом процессе) числе итераций К ме- 
тод (3.27) будет обеспечивать наименьшую погрешность, иначе, 


р ; 
минимизировать величину | х - хи, в том случае, когда пара- 


метры т/х вычисляются по формуле 
2 


НИИ. „РИН (3.29) 
(Аах + Ат ) + (А вах ыы Ат и 


тр = 


к. Смысл термина «двухслойный» становится понятным при изуче- 
нии численных процессов решения уравнений математической физики 
(см. гл. 20). Изучая же численное интегрирование систем ОДУ ($ 15.5), 
обнаруживаем, что (3.27) есть не что иное, как явный метод Эйлера (с пе- 
ременным шагом ) для задачи (3.25). 


117 


(2-х 


где А =0,1й ‚К-1, а {+ =с03 —щ корни полинома Че- 


бышева К-й степени (см. $ 9.1). Совокупность формул (3.27), 
(3.29) называют явным итерационным методом с чебышев- 
ским набором параметров. Имеется обобщение приведенного 
утверждения и на неявный случай. 


Дальнейшее формальное развитие методы установления по- 
лучают как сугубо неявные методы вида (3.28) с матрицами Ву, 
представляемыми в виде произведения простых легко обращае- 
мых (например, ленточных) матриц, в связи с чем такие методы 
называются методами расщепления. Из методов расщепления 
наиболее известными являются методы переменных направле- 


ний) и попеременно-треугольный метод. Неформальное изу- 
чение этих методов более целесообразно по месту их примене- 
ния: при численном решении многомерных задач математиче- 
ской физики (см. далее гл. 21). 

Рассматриваются также шрехслойные итерационные ме- 
тоды (в частности, с чебышевскими параметрами), связывающие 
уже не два, а три соседних приближения: х т х) их. В 
отличие от предыдущих, такие методы являются двухшаговыми. 


Другой большой класс методов итерационного решения 
СЛАУ (3.1) — это так называемые методы вариационного ти- 
па. К ним относятся методы минимальных невязок, минималь- 
ных поправок, минимальных итераций, наискорейшего спуска, 
сопряженных градиентов и т.п. Хорошего понимания и обосно- 
вания таких методов можно достигнуть лишь с привлечением 
теории оптимизации, ибо решение линейной алгебраической сис- 
темы здесь подменяется решением эквивалентной экстремальной 
задачи. 

А именно, пусть Ах = — нормальная и-мерная система, 
т.е. А — положительно определенная симметричная матрица, и 
пусть (.,-) — скалярное произведение в пространстве В „. Обра- 
зуем квадратичный функционал 

Ф(х)=(Ах, х)—2(Ь,х)+с, (3.30) 
где се В; — произвольная постоянная. Задача решения нор- 


мальной системы (3.1) и задача минимизации функционала (3.30) 
эквивалентны ([152] и др.). Действительно, нормальная система 


* 
) В зарубежной литературе используется аббревиатура АБГ — 
АПегпайи® Отесйоп [трйсйе [43, 137]. 
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* 
имеет и притом единственное решение; обозначим его х . Тогда 
* 
при любом векторе х=х +А 


Ф(х) = ФС" +А)= (А(° +4), х +А)-26, х +4)+с= 
=(Ах’, х°)+ (Ал, х)+(Ах, А)+ (АЛ, ^)—2(ь, х )-2, А)+с= 
=Ф(х’)+ (Ал, х)+(Ах’, д)-2(Ах’, А)+ (Ал, д)= 
=Ф(х") + (Ал, ^)>Ф(х'), 

в силу самосопряженности и положительности А; значит, 
Ф(°)= н- Ф(х). 


Теперь можно применять различные методы численной ми- 
нимизации функционала Ф(х) (в конечном итоге, функции 
п переменных х1, х›,Й ‚х»). 


Одним из наиболее популярных и хорошо разработанных 
методов подобного типа является метод сопряженных гради- 
ентов. Приведем без вывода алгоритм, быть может, недостаточ- 
но подробный, но вполне определенный, чтобы с его помощью 
можно было решать нормальные СЛАУ (3.1) таким способом [138]. 
Фигурирующим в нем переменным можно придать следующий 
оптимизационный смысл: 


(К) ы 
х’’ — А-е приближение к искомому решению х ; 


&® — невязка А-го приближения, играющая роль антигра- 


диента функции Ф(х); 


р) — направление минимизации функции Ф(х) в точке 


(Ю. 
) 
@; — коэффициент, обеспечивающий минимум Ф(х) в на- 


правлении вектора р ) 


х 


— В, — коэффициент при р в формуле для вычисления 
направления р (+), обеспечивающий А-сопряженность векторов 
р® и р (+ (а® — вспомогательный вектор). 


Алгоритм МСГ 


Шаг 1.1. Задать х®) (начальный вектор) и число &>0 
(допустимый уровень абсолютных погрешно- 
стей). 
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Шаг 1.2. Вычислить вектор &(0) =Ь- Ах(0) (невязка 
начального приближения). 


(0) 


Шаг 1.3. Положить р” = &(0), К =0 (номер итерации). 


Шаг 2.1. Вычислить вектор а(о = Ар(О. 


Шаг 2.2. Вычислить скаляр @у = °®, р) (а, р) 
(шаговый множитель). 


НО 509 +ахр 9 (очеред- 


Шаг 2.3. Вычислить вектор х 
ное приближение). 


(+ — =) 


Шаг 2.4. Вычислить вектор & —са® (невязка 


(К +1)-го приближения”) ). 


Шаг 2.5. Проверить выполнение неравенства | я 28 


если «да», остановить работу алгоритма и вывес- 
ти результаты. 


Шаг 3.1. Вычислить скаляр Ду = (Е, а )/ (р, а(9). 


Шаг 3.2. Вычислить вектор р +0 = &+0 - Вер (новое 
направление минимизации). 
Шаг 3.3. Положить А := А +1 и вернуться к шагу 2.1. 


Интересно определить место, которое занимает этот метод в 
общей классификации методов решения линейных алгебраиче- 
ских систем. Дело в том, что метод сопряженных градиентов, яв- 
ляясь по форме итерационным, фактически должен быть отнесен 
к прямым методам, ибо доказано, что с его помощью минимум 
квадратичной функции (3.30) от и переменных, иначе, решение 
п-мерной линейной системы (3.1), достигается ровно за и шагов 


при любом начальном векторе х(0). Применяют же метод сопря- 
женных градиентов именно как итерационный метод (что видно 
и из приведенного алгоритма), имея в виду два обстоятельства. 


* 
) Полагая & (0 =Б- Ах(®, видим, что, в силу 2.3 и2.1, 
Е =Ь-— Ах(+О =Ъ— Ах(®) — Аар® =Е( ср Ар® = -с9®. 


+1 
Использование такого выражения невязки Е ) позволяет обходиться без 


вычисления вектора Ах(+0. Однако нужно понимать, что подобная эко- 
НОмМиЯ В арифметических операциях может отразиться на вычислительной 
устойчивости метода. 
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Во-первых, реальный вычислительный процесс может быть до- 
вольно далек от идеального и, вследствие неизбежных ошибок 
округления, на и-м шаге может быть не достигнута нужная точ- 
ность. Во-вторых, если размерность и решаемой задачи велика, 
то число шагов, достаточное для получения решения системы с 
нужной точностью (т.е. выход по критерию 2.4), может оказаться 
значительно меньшим этой (п) теоретической величины. 


Покажем сначала возможности метода сопряженных гради- 
ентов на очень простом примере, где точное решение найдется 
раньше, чем будет выполнен полный цикл предложенного алго- 
ритма. 


Пример 3.4. Для решения системы 


2х1 т ^5 =1, 
м +2х=-1 


21 

с положительно определенной матрицей А= га] * правой частью 
1 (0) 

Ь = возьмем начальное приближение х = 0 з Его невязка 


1 
(0) =Ь-Ах(0) = | В соответствии с алгоритмом далее имеем: 


| | 
р =) = (. |, а® = Ар® = [. ) 


и, следовательно, 


(©, р) 


Таким образом, находим первое приближение 


0 1 71 
ай -(5)- | (. |= ] 
= [И |=) 
5 =5 ^- 409 -] ь о} 


1 
говорящей о том, что х” = х( -( } 


с невязкой 


= 


Теперь рассмотрим пример более типичного поведения ме- 
тода сопряженных градиентов, применяя его к трехмерной 
СЛАУ с симметричной положительно определенной матрицей 
коэффициентов. 
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Пример 3.5. Дана система Ах=Ь, где 


2:0 1 1 
= 0 1 _1] ‚ = 2 . 
1-12 2 


Продемонстрируем все расчеты, выполняя шаг за шагом предписа- 
ния алгоритма сопряженных градиентов, игнорируя лишь шаг 2.5, по- 
скольку задавать & здесь нет смысла ввиду малой размерности системы. 


Приняв за начальное приближение х``’ нуль-вектор, далее последо- 
вательно вычисляем: 


| | 0 
(0) —_в- Ах | 2 , р) = (0) = а | а® =Ар@©) = 4 
= $ = 
0.5 
09 (0) 
_ 60, 0) о_ ©) (0) _ 
@0 = (0) (0) т. хо =хХ + “ор =| 1 › 
0”, В = 
(=) (0) 50, 4) 5 
= -209` = 0 |, Д:= с, 
(0) (0) 36 
0.5 а р 
41 90 
(0 Е — в, р) — 1. 10 Ве Е Е 
р`’=5`”- Др 36 с = ь 
47 
0.951542 
(и 
а: 52) 90 „0964, хх +нр® =| 1.110132 |, 
(@®, р®) 227 
ЬЕ _ 0.911894 
0.008810 0 
(2) _ =() | Вит: м В 
59 = +4” =| - 0.022026 |, А =Р“ п1= 0.000699, 
— 0.017621 9”, 
0.009606 0.001746 
р(2) = &2) — Вр =| - 0.021832 |, а@)=Ар@) =| - 0.004366 |, 
_ 0.017466 _ 0.003494 
0.999998 
= 5.044386, х3)=х() + р) =| 1.000003 
_ 0.999999 


Отличие вектора х(3) от истинного решения х” = (1; 1; 1)’ обусловле- 


но лишь ошибками округления, а о том, что х(3) действительно можно 
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а * 
считать искомым решением с определенной точностью (не зная Х ), сле- 
дует судить, выполнив еще один шаг, именно, подсчитав невязку 3). 


Простейший вариант метода минимальных невязок опре- 
деляется совокупностью формул 


хх ЕЮ, &® = Ах -Ь, т, = 


Его можно рассматривать как явный двухслойный итерационный 
процесс (3.27), в котором параметр т. на каждом итерационном 
шаге К=0,1,2,й выбирается таким, чтобы минимизировалась 


евклидова норма невязки &%0 


х(+0. 


получаемого приближения 


ЕН —. Ах(Е+О 


Действительно, вычтем из вектора —Ь век- 


тор &®. Имеем 
ЕКО Е = Ах(+0 — Ах(®) = Ах © -Ат,® — Ах, 
рые. 
ЕО = &(0 ив т. АЕ®. 


Возводя последнее равенство в квадрат (в смысле скалярного 
умножения векторов), получаем 


(+, =) (Е, 50-20 (=, Е + г? (АЕ, АЕ) 


или, что то же, 


| ь ЕО 2, (АЕ, Е) г? 1 АЕ. 


Легко видеть, что минимум этой положительной квадратичной 
функции (значит, и величины | достигается именно при 


указанном в записи метода значении Ту. 

В случае нормальной системы для метода минимальных не- 
вязок можно получить ту же оценку скорости сходимости, что и 
для метода простой итерации 


т = (Е-гА)х(9 +75 
2 
при оптимальном значении параметра т = —————— (в пред- 
Ат а Атах 
положении, что известны границы Яшиш И Яшах Спектра 
матрицы А) [158]. 
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Рассмотренные здесь методы далеко не исчерпывают все 
многообразие итерационных способов решения СЛАУ. В частно- 
сти, нами совсем не затрагивалась проблема решения больших 
разреженных систем, где на первый план выходят блочные мето- 
ды, максимально сохраняющие исходную разреженность матриц 
(см., например, [29, 64, 197]). 


$ 3.6. БЫСТРОСХОДЯЩИЙСЯ ИТЕРАЦИОННЫЙ 
СПОСОБ ОБРАЩЕНИЯ МАТРИЦ 


Согласно леммам 3.1, 3.2 (см. $ 3.1), если матрица В =Е-А 
мала (в смысле ее нормы или собственных значений), то обрат- 
ная к А матрица 


А =(Е- В)! =Е+В+В2+й , 


в принципе, может быть найдена сколь угодно точно прибли- 
женным суммированием данного матричного ряда. Однако такой 
непосредственный подход к вычислению имеет два очевидных 
недостатка: во-первых, реально его можно применить лишь для 
обращения матриц, близких к единичной, во-вторых, сходимость 
последовательностей частичных сумм этого ряда будет медлен- 
ной даже при достаточно малых нормах матриц В. Поэтому, 
пользуясь отмеченным фактом лишь как теоретической основой, 
построим итерационный процесс, определяющий существенно 
более быстро сходящуюся последовательность приближений к 


обратной для А матрице А“. Будем далее обозначать эти при- 
ближения, получаемые на К-м шаге, через Ох, а их невязки 


ЕАО; — через 4х. 


Лемма 3.3. Если для матрицы А найдется такая об- 
ратимая матрица Чо, что модули всех собственных чисел 


матрицы Фу =Е-АОй меньше единицы, то матрица А 


обратима и для обратной матрицы справедливо представ- 
ление 


В (3.31) 


Доказательство. Из равенства 
АО‹ =Е-—Фо, (3.32) 
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в силу обратимости матриц Шо и Е-Ф0 (последнее по 
лемме 3.1), имеем 
= —1 
ы —1 —1 —1 
А=(Е-Ч0о)00 -((Е-+о) 00 )- бобЕ-ч) ) 
т.е. матрица А обратима и справедливо представление 
А! =00(Е- 0)". 


Доказательство завершается разложением (Е-Чо) | в матрич- 


ный ряд (лемма 3.1). 
Очевидным следствием лемм 3.2 и 3.3 является следующая 
лемма. 


Лемма 3.4. Пусть матрица Чо обратима и || <1. 
Тогда: 

1) существует матрица д ь 

2) справедливо представление А! по формуле (3.31); 


3) имеет место оценка |7] < Ю. 


1- Мо 


Для построения итерационного процесса зафиксируем в 
разложении (3.31) т-+1 первых слагаемых и будем считать пер- 


вым приближением к А 1 матрицу 
= (+ 0+й +4"), 
Найдем выражение невязки Ч этого приближения через невязку 
Чо предыдущего (в данном случае начального) приближения Оф: 
+, =Е-АО] -Е-АОо (+40 +й +") 
= Е-(Е-40 {Е ++, +й +40, )= ЕЕ” чл 


Благодаря полученной связи между невязками, можно утвер- 
ждать, что если выполняются условия лемм 3.3 или 3.4 по отно- 
шению к матрицам Чо, Фо, то для матриц 91, 4. они будут 
выполнены и подавно. Следовательно, к матрицам Оу, Фу, мож- 
но применить все рассуждения, проведенные выше для Оу, Ф(. 


Таким образом, приходим к итерационному процессу 
+, =Е-АОГ, 
я (3.34) 
Ор = о, (Е ++, +Й +; ) 
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где А=0,1,2,й — номер итерации; Ч) — задаваемая начальная 


матрица, близкая к АА указанном выше смысле, а те М — 
параметр метода. 
Изучим сходимость этого процесса. 


Теорема 3.13. Пусть квадратные матрицы А и Пу 
таковы, что матрица Чо обратима и |№‹|<1. Тогда су- 
ществует обратная к А матрица А! ик ней сходится 
последовательность матриц Чу, определяемая итераци- 
онным процессом (3.34). При этом имеет место точное 


равенство 
|: 
ти, = о —1 (3.35) 
и справедливы оценки погрешности: 
[Ао В= Оч. 
В «| 
|: 
—_ Чо (т-1) 


Доказательство. Существование А! следует из лем- 
мы 3.4. Упомянутая повторяемость рассуждений и выкладок, 
проведенных на первом итерационном шаге, позволяет считать 
очевидными равенства типа (3.31), (3.33) для А-Й итерации: 


АТ =, (Е, =, (+4, +42 + ), (3.36) 


2 [4 
ЧЕ ЕАО; = 4 = 4 р =, (3.37) 
Из (3.31) имеем 
= +4 +42 +й уе 


(3.38) 
= (+40 +40 +й №, = А, 
а из (3.36) аналогично (с учетом (3.37)) получаем 
К 
-Ор=А = А О. (3.39) 


Заменяя здесь в правой части А) на А" —Оо (см. (3.38)), 


получаем утверждаемое в теореме равенство (3.35). Переходя в 
нем к нормам, в соответствии с условием заключаем, что 


| 


ое ом п, 


>) 
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т.е. имеет место сходимость последовательности (Че) к мат- 


рице А-! по норме, а значит, и поэлементная сходимость. 
Для доказательства первой оценки (апостериорной) вычтем 
Ох из (3.36): 


А! — 0х =, (Е+ч, +47 +й в =9, 4, (Е-4,) 1. 


Отсюда по лемме 3.2 с учетом (3.37) получаем требуемую 
оценку 1). 

Вторая оценка (априорная) может быть найдена в результа- 
те загрубления первой. Но можно вывести ее непосредственно из 


равенства (3.39), подставив в его правую часть вместо А вы- 
ражение Оо(Е-Ч у)" (см. (3.31): 


К 
Ар = Чо (Е-4 0) 14. 


Переход к нормам в последнем равенстве и привлечение 
леммы 3.2 завершает доказательство теоремы. 

Равенства (3.34) определяют фактически не один, а целое 
семейство итерационных методов обращения. Фиксированием 
параметра т=1,2,й можно получать конкретные процессы 


(т+П)-го порядка скорости сходимости”. Этот порядок может 
быть сколь угодно большим, однако обычно ограничиваются 
процессами второго (т=1) и третьего (т=2) порядков. При- 
оритет процесса второго порядка связан с его простотой и более 
ранним появлением: первая публикация об этом методе относит- 
ся к 1933 г. и принадлежит Г. Шульцу [205], в связи с чем и все 


семейство (3.34) естественно называть методом Шульца“). Ме- 
тод третьего порядка целесообразно использовать из тех сообра- 
жений, что он, как показал М. Альтман [201], обладает свойст- 
вом минимальности вычислительных затрат, требующихся для 
обращения матриц с заданной точностью методами семейст- 
ва (3.34). 

Отметим, что как сам быстросходящийся итерационный 
процесс (3.34), так и представленные теоремой 3.11 результаты 
можно без каких-либо особых дополнительных условий отнести 
к более общей задаче обращения линейных ограниченных опера- 
торов в полных нормированных пространствах. 


* 
) Определение порядка итерационного процесса см. далее в $ 5.3. 


жж 
) В разных литературных источниках можно встретить и другие 
названия этого метода: Хотеллинга, Бодевига (Бодвига), а также Ново. 
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Процесс (3.34) построения приближений к обратной матри- 
це легко видоизменить подобно тому, как это было сделано с ме- 
тодом простых итераций решения СЛАУ, когда для более опера- 
тивного учета получаемой на текущей итерации информации пе- 
решли от него к методу Зейделя (см. $ 3.3). Например, зейделева 
модификация метода Шульца второго порядка может быть 
определена равенствами 


ь =Е-АО,, 


— (3.40) 
Ор = Ч + О + 1, 


где А=0,1,2,й ; Ч; =Ч, +, , а Ч, и %, — соответственно 


нижняя треугольная и строго верхняя треугольная матрицы [36]. 
При реализации этой модификации нужно либо расписывать 
формулы (3.40) поэлементно (чтобы не работать с заведомо ну- 
левыми элементами), либо формировать матрицу Ч ; +1 постепен- 


ным замещением старых элементов новыми, осуществляя на К-Й 
итерации цикл присвоений 


О:=О+0%, 


где до начала цикла в правой части в двумерном массиве Ц 
должна содержаться матрица Ох, а в двумерном массиве + — 
матрица 4; (заполнение массивов новыми элементами произво- 
дится по строкам). Процесс (3.40) при том же шаговом объеме 
вычислений и такой же простоте, что и в методе Шульца второго 
порядка, может дать определенный выигрыш в скорости сходи- 
мости. Это можно показать сравнением невязок первых прибли- 
жений при тех или иных предположениях относительно началь- 
ной невязки, иначе, при тех или иных требованиях к начальной 
матрице Оу [36]. 

Вообще, проблема выбора начального приближения Од в 
рассматриваемых здесь процессах итерационного обращения 
матриц не позволяет относиться к ним как к самостоятельным 
универсальным методам, конкурирующим с прямыми методами 
обращения, основанными, например, на 1-разложении матриц. 
Имеются некоторые рекомендации по выбору Чу (см. [20, 20] и 


* 
др.), обеспечивающие выполнение условия ) Ро) <1, являю- 
щегося необходимым и достаточным для сходимости процесса 


* 
) Через р(:) здесь обозначается спектральный радиус указанной в 
скобках матрицы. 
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(3.34). Однако при этом, во-первых, требуется знать оценку свер- 


ху спектра обращаемой матрицы А либо матрицы АА” (а имен- 
но, если А — симметричная положительно определенная 


и р(А) < В, то можно взять Чу =аЕ, где Е (0, 2/8); если же 
А — произвольная невырожденная матрица и р(АА’ )< В, 


Г 
то полагают Оу=@А’, где также &е(0,2/6); можно, 
конечно, упростить ситуацию и, воспользовавшись тем, что 


р(Ал" )<[Ал1 |, положить Оо = АТ /|ААТ |). Во-вторых, при 


таком задании начальной матрицы нет гарантии, что |4 < | будет 
малой (возможно, даже окажется №0]>1), и высокий порядок 
* 


скорости сходимости обнаружится далеко не сразу ). 

Все сказанное выше не означает, что подобные методы об- 
ращения матриц (и операторов) не имеют своей сферы примене- 
ния. В частности, ниже (в $ 7.2) будет рассматриваться способ 
решения систем нелинейных уравнений, базирующийся на мето- 
де Ньютона с приближенным обращением матриц Якоби по ме- 
тоду Шульца, ав $ 18.4 метод Шульца используется как состав- 
ная часть квадратурно-итерационного метода вычисления ре- 
зольвент линейных интегральных уравнений. 


$ 3.7. ОРОЛИ ОШИБОК ОКРУГЛЕНИЯ 
В ИТЕРАЦИОННЫХ МЕТОДАХ 


Обратимся, наконец, к вопросам практической реализации 
итерационных методов решения линейных алгебраических 
задач. 

Многие утверждения о сходимости итерационных процес- 
сов говорят о том, что решение поставленной задачи при опреде- 
ленных условиях может быть найдено этим процессом сколь 
угодно точно, причем погрешность каждого приближения может 
быть эффективно проконтролирована (см. теоремы 3.2, 3.6, 3.8, 
3.12, а также теорему 3.3 с замечанием 3.5 и теорему 3.9 с заме- 
чанием 3.7). Нетрудно понять, что все это справедливо на самом 
деле лишь до тех пор, пока на погрешность метода (остаточную 
погрешность) не наложится вычислительная погрешность (по- 
грешность округлений), неизбежная при любых реальных ком- 


* 
) Более прост случай, когда в обращаемой матрице А = (ау) имеется 


диагональное преобладание: взяв Оу = 8 ( Иа. ), получим [4 1. 
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пьютерных расчетах. Особенно существенное и даже пагубное 
влияние на результат решения задачи итерационным методом 
могут оказать ошибки округления в тех случаях, когда утвержде- 
ния о сходимости метода не содержат эффективных оценок по- 
грешности (теоремы 3.1, 3.4, 3.5, 3.10, 3.12). 

Рассмотрим различие между реальным и идеальным итера- 
ционными процессами на простейшем объекте -— на методе про- 
стой итерации. 

Пусть на А-м итерационном шаге вычислений по методу 
(3.3) ошибки округлений составляют вектор у®. Тогда в отли- 
чие от идеального МПИ (3.3), генерирующего последовательность 


приближений х(®) к решению х системы (3.1) такому, что 


х’=Вх” +с, (3.41) 
реальный МПИ будет иметь вид 
+0 = Вх +е+у0. (3.42) 
Изучим поведение векторов 
ше = хх 
— ошибок приближений х(0, получаемых реальным МПИ 


(3.42). 
Вычитая (3.41) из (3.42), имеем 
5 х* = в ® —х*) +70, 
те, 


К К К 
Мрт = Вид +7 = В(Вых +70)+7® = 
5) В 
= В? (Вы; _, +74 + ву( +) =й = 


= Во + (Ву +в + + ву +70). (3.43) 


Первое слагаемое в последнем выражении отвечает за по- 
грешность идеального МПИ и может быть сделано сколь угодно 
малым в процессе итерирования при условии р(В)<1 (см. лемму 
3.1). Чтобы оценить второе слагаемое, предположим, что порог 
абсолютных погрешностей округлений, допускаемых на каждой 
итерации, есть у ‚ т.е. 


У <у УЁЕМо. 
Тогда 


[Ву +в + +в +76 < ДЕ+В+.-.+В^ 


| 
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и, если |[|В||< а <1, то второе слагаемое в (3.43), хотя и не стре- 
мится к нулю, но ограничено по норме величиной 


К 

р 
11а Га 

При условии же р(В)<1, теоретически обеспечивающем сходи- 
мость идеального МПИ (3.3), малость этого второго слагаемого 
отнюдь не гарантируется, что означает допустимость ситуаций, 
когда в ходе реальных итераций погрешность округлений будет 
накапливаться вплоть до переполнения множества чисел, пред- 
ставляемых используемым компьютером. 

Более детальный анализ влияния ошибок округления на 
итерационный процесс с попыткой пролить свет на природу это- 
го влияния можно найти, например, в [13]. Здесь же ограничим- 
ся напоминанием о том, что необходимо с осторожностью при- 
менять процессы, когда для них нет эффективных оценок по- 
грешности, и по возможности, учитывать влияние ошибок округ- 
ления, если такие оценки есть. Например, применительно к МПИ 
решения СЛАУ выше фактически доказана 


Теорема 3.14.°) Пусть |В|< 4 <1 и приближения х® 


к решению х’ системы (3.2) получаются посредством ра- 
венства (3.42), где у  — вектор ошибок округлений та- 
ких, что | [5х. Тогда погрешность К-го приближения 
при любом К Е М можно оценить неравенством 


= бань. (3.44) 


Действительно, для последовательности (“ )), получаемой 


МПИ (3.3), справедливо равенство 
ии кН в (* —_ х(0). 


Следовательно, считая, что процессы (3.3) и (3.42) начинаются с 


одного начального приближения х(0 =х( ), в идентичном (3.43) 
равенстве 


5—5 =" 50) (В© +в + +ву-0 +) 


можно заменить ве -х©) на х —х(0. Таким образом, 
*) 
См. также [3]. 
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погрешности (А-+1)-х приближений реального (3.42) и идеально- 
го (3.3) методов различаются лишь слагаемым, оцененным выше 


по норме величиной ПЕ т.е. и для процесса (3.42) можно вос- 


пользоваться оценкой, выведенной в теореме 3.2. 

Отметим, что как непосредственно видно из оценки (3.44) 
(при значениях 4, приближающихся к единице), роль ошибок 
округлений в образовании общей погрешности тем сильнее, чем 
медленнее сходимость итерационного процесса. 


УПРАЖНЕНИЯ 


3.1. Запишите итерационный процесс Якоби нахождения решения 
системы 


ЗЖ + 2х2 — ж+ 24= 9, 
х - 42 + 2ж4= №, 
2% + Зхо - 9жз- хд =-1, 
За хз - бх4 = -5. 


Каким должен быть критерий окончания процесса итерирования, чтобы 
максимальная из абсолютных погрешностей компонент приближенного 
решения не превышала заданного малого => 0? 


3.2. Проверьте, выполняются ли необходимые условия сходимости 
методов Якоби и Зейделя, примененных к системе 


м +х2 = 9. 
Хх +2х> +3 = 4, 
Х2 + 2х3 = 92 


3.3. Сделайте по пять итераций методов Якоби и Зейделя для системы 
10% + х2- 2ж = 10, 
х -— 5х2 + жз = 19, 
Зм-— хо + 10% =-5. 


Сколько верных знаков можно гарантировать в приближенных решениях, 
полученных тем и другим способами ? 


Т 
3.4. Докажите, что при любом начальном векторе (©, ©), 2) 


Т Т 
последовательности векторов (®, У®, 2®) и (о, У, 2) ь 
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определяемые при А=0, 1, 2,й равенствами 


20 0х +029 3, 
У =0.2х9 0.1 +0.1=® +2, 
200 —=0.3х(9 +0.22® —1 


ЖЕН (у 30/5, 
хо 6х += +20)/11, 
20) = вх +10), 


жж жж ж\Г 
сходятся, причем к одному и тому же предельному вектору ( ,‚Уу,2 ) $ 
Запишите линейную систему (в стандартном виде), решением которой 
служит этот предельный вектор. За сколько шагов итераций по данным 


формулам можно получить предельный вектор с точностью в=10-6 (по 
норме-максимум), если начать счет с нулевого вектора ? 


3.5. Пусть методом Якоби решение системы 
Вх + +ЧхьЕк ((=1.2.й ; [И =4„=0) 
с нужной точностью достигается за К шагов. Существуют ли такие А ип, 


при которых применение метода Якоби в этой ситуации эффективнее ме- 
тода прогонки по числу арифметических операций ? 


3.6. Для линейной системы 


х1 + 2х2 + 3х3 = 5, 
2х — х2 + 2% = 8, 
Зх + № - жж -жм4=-|, 
4х! = хз +2х4 = 8 


запишите метод Зейделя и обоснуйте его сходимость. Каковы расчетные 
формулы метода ПВР в этом случае ? 


3.7. Убедитесь, что к системе 


х + 2х2 = Зы 
2х1 +2х> +хз = 5, 
х2 + 2х3 = 


неприменим метод Якоби и что ее матрица не является положительно опре- 
деленной. Выполните симметризацию Гаусса И убедитесь, что новая систе- 


133 


ма — нормальная. Запишите для нее процессы Зейделя и релаксации. Оп- 
робуйте последний при значениях параметра релаксации @, больших и 
меньших единицы (например, полагая @ =1.2 и @ =0.8). Сравните резуль- 
таты применения методов верхней, нижней и полной релаксации. 


3.8. Дана система 
7ж1 +5х2 +хз =2.2, 
5х1 +8х2 +2хз =2.4, 
Хх +2х> +4хз 6 
Найдите четвертое приближение к ее решению по методу минимальных 
невязок, начиная итерационный процесс с нулевого вектора. За сколько 
итераций по методу Якоби достигается примерно такая же величина евк- 


ЛИДОВОЙ нормы невязки? Сравните вычислительные затраты, требующие- 
ся для реализации одного шага каждого из этих методов. 


3.9. Методом сопряженных градиентов решите систему 


Зм +2% +ж = З3, 
2х +2х%  -ж = -2, 
Хх —№ +2х 3 = 4. 


3.10. Предположим, что некоторая ихи-система вида х=Вх+с с 
В]=0.5 решается методом простых итераций с уровнем абсолютных по- 


грешностей арифметических операций порядка 10-6. Допустим, что при 
этом | М =х® 1. Каким числом следует ограничить количество итера- 


ций, чтобы вычислительная погрешность не стала существенно превы- 
шать погрешность метода? 


3.11. Даны матрицы 


| 23 0.1 0.6 0.9 
А= 12| и № = -044 0.9 0.6 
В == 0.1 0.4 0.1 


А) Подсчитав невязку чу =Е-АПц, убедитесь в существовании 
матрицы А-' иоцените какую-либо ее норму. 
Б) Сделайте по два приближения к А-' методом Шульца второго и 


третьего порядков и оцените близость полученных приближений к А 
В) Сравните оценки погрешностей приближений с истинными 


ошибками, найдя А! каким-нибудь прямым методом. 
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ГЛАВА 4| МЕТОДЫ РЕШЕНИЯ 
АЛГЕБРАИЧЕСКИХ ПРОБЛЕМ 
СОБСТВЕННЫХ ЗНАЧЕНИЙ 


Затрагивается наиболее сложная задача вычислительной 
линейной алгебры — нахождение собственных чисел и собствен- 
ных векторов матриц. Рассматриваются современные подходы 
к решению спектральных задач для вещественных матриц уме- 
ренной размерности, базирующиеся на прямой и обратной ите- 
рациях (в том числе, со сдвигами), а также на приведении мат- 
риц к диагональной или треугольной формам ортогональными 
преобразованиями подобия. Показываются идеи методов, выво- 
дятся расчетные формулы, даются конкретные алгоритмы, по- 
зволяющие в оговоренных ситуациях решать частичные и пол- 
ные проблемы собственных значений до конца. 


4.1. СОБСТВЕННЫЕ ПАРЫ МАТРИЦЫ 
И ИХ ПРОСТЕЙШИЕ СВОЙСТВА 


Пусть А — вещественная ихя-матрица, у=у(1) —п- 
мерная векторная функция скалярного аргумента {, и пусть 
ищутся нетривиальные решения системы дифференциальных 


уравнений 
Г 


=А 4.1 
= у (4.1) 


в виде у=е*х, где хеЕС,, ЛЕС. Подставляя у и 4 в (4.1), 
получаем ыы 

де х = Ае\"х ь 
т.е. система (4.1) действительно будет иметь решения заданного 


вида в том и только том случае, если найдутся такие пары чисел 
ди ненулевых векторов х, что 


Ах=дх. (4.2) 


Имеется ряд других примеров из областей, лежащих за пре- 
делами линейной алгебры, в которых также приходят к необхо- 
димости решать подобные (4.2)) алгебраические задачи, называе- 
мые задачами на собственные значения (см., например, [85]). 
При этом различают полную (алгебраическую или, иначе, 
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матричную) проблему собственных значений, предполагаю- 
щую нахождение всех собственных пар {1,х} матрицы А, и 
частичные проблемы собственных значений, состоящие, как 
правило, в нахождении одного или нескольких собственных чи- 
сел АД и, возможно, соответствующих им собственных 


векторов’) х. Чаще всего, в последнем случае речь идет о нахо- 
ждении наибольшего и наименьшего по модулю собственных чи- 
сел; знание таких характеристик матрицы позволяет, например, 
делать заключения о сходимости тех или иных итерационных ме- 
тодов, оптимизировать параметры итерационных методов, учи- 
тывать влияние на результаты решения алгебраических задач по- 
грешностей исходных данных и вычислительных погрешностей 
(потребность в таких числах неоднократно возникала в гл.3). 
Имеются и несколько иные постановки частичных проблем [12, 
13, 44, 85]. 

Трактуя А в равенстве (4.2) как матрицу линейного преоб- 
разования в пространстве В,„, задачу на собственные значения 
можно сформулировать так: для каких ненулевых векторов х и 
чисел А линейное преобразование вектора с помощью матрицы 
А не изменяет направления этого вектора в В», т.е. сводится к 
«растяжению» этого вектора в Й раз? Эта задача, очевидно, эк- 
вивалентна задаче исследования однородной СЛАУ") с пара- 
метром: при каких А система 


(А-ЛЕ)х=0 (4.3) 


имеет нетривиальные решения? Найти эти решения. 

Теоретически эта задача легко решаема: нужно найти корни 
так называемого характеристического или иначе «векового» 
уравнения 


4екА-лЕ)=0 (4.4) 


и, подставляя их поочередно в (4.3), получать из соответствую- 
щих вырожденных систем собственные векторы. Практиче- 


* 
) Собственное число и собственное значение в данном контексте — 
синонимы. В более общем случае, когда А в (4.2) — некоторый оператор, 
собственные элементы х могут иметь другую природу. 


#* 

) Здесь, как и ранее, аббревиатура СЛАУ означает «система ли- 
нейных алгебраических уравнений», а обозначение Е зарезервировано за 
единичной матрицей. 
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ская реализация этого в сущности простого подхода сопряжена с 
рядом трудностей, возрастающих с ростом размерности решае- 
мой задачи. Трудности эти обусловлены развертыванием «веко- 
в0го» определителя 4еКА-ЛЕ) и вычислением корней полу- 
чающегося при этом многочлена и-й степени, а также поиском 
линейно независимых решений вырожденных СЛАУ. В связи с 
этим такой непосредственный подход к решению алгебраической 
проблемы собственных значений обычно применяют лишь при 
очень малых размерах матриц А (п=2,3); уже при п>4 на пер- 
вый план выходят специальные численные методы решения та- 
ких задач. Ниже будут рассмотрены некоторые из этих методов 
так, чтобы можно было понять идеи, лежащие в их основе, и в то 
же время получить возможность решать поставленные задачи до 
конца для некоторых классов матриц (более полное и глубокое 
изложение этой темы см. в монографиях [75, 141, 179, 180] ив 
учебных пособиях [3, 12, 13, 20, 42, 61, 78, 99]. 

Следует заметить, что если в недалеком прошлом числен- 
ные методы решения задач на собственные значения опирались, 
как правило, на классический подход, т.е. на развертывание ве- 
ковых определителей, в частности, в простейшем случае с помо- 
щью приведения матрицы А подходящим преобразованием к так 
называемой сопровождающей матрице [75, 179] 

С] С2 С3 -.. Сил Си 
100. 0 0 


С©С= 01. 0 0, 


оо. го 


где в первой строке стоят коэффициенты уравнения (4.4), запи- 
санного в виде 


(-1)” [ а -ьТ-й незА-вн= 0, 


то современные методы решения полной проблемы ориентиро- 
ваны на алгоритмическое построение из матрицы А такой мат- 
рицы, определенные элементы которой являлись бы приближен- 
ными значениями собственных чисел А, причем параллельно 
формировались бы и ее собственные векторы. 


Прежде чем приступить к изучению методов нахождения 
собственных чисел и векторов, вспомним некоторые простые их 
свойства, требующиеся в дальнейшем. 
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Свойство 4.1. Если {1,х} — собственная пара мат- 
рицы А, а а(=0) — некоторое число, то {1, их! также 
является собственной парой для А. 


Действительно, умножив верное для данных А и х равенст- 
во (4.2) на число ©, получаем верное равенство 


А(ах) = А(ах). 
Оно означает, что каждому собственному числу А соответствует 
бесчисленное множество собственных векторов, различающихся 
лишь скалярным множителем. Такие векторы задают одно и то 
же направление в и-мерном пространстве; в соответствие этому 
направлению можно поставить нормированный вектор или орт 


(вообще говоря, одному собственному числу может соответство- 
вать и несколько линейно независимых собственных векторов). 


Свойство 4.2. Пусть {и, х} — собственная пара мат- 
рицы А-реЕ при некотором рЕВ. Тогда {4 = и+р, х! — 
собственная пара матрицы А. 


Чтобы убедиться в этом, заметим, что по условию 
(А-рЕ)х = дих (4.5) 


при данных д и х — верное равенство. Рассмотрим равенство 
Ах=йх при д=и-+р: 


Ах = (д+ рух. 


Оно равносильно (4.5), и значит, справедливо; с другой стороны, 
говорит о том, что {й,х} — собственная пара А. 


Как видим, прибавление к данной матрице А скалярной 
матрицы рЕ не изменяет ее собственных векторов и смещает 


спектр, исходной матрицы на число р (влево при р>0). 
Свойство 4.3. Если {1,х} — собственная пара обра- 
тимой матрицы А, то |. «| — собственная пара мат- 
рицы д 1, 


Справедливость этого свойства очевидна: умножив верное 


* 
) Напомним, что спектром матрицы называется множество всех 
ее собственных значений. 
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Ъ = 
для данных Я и х равенство Ах=Дх слева на матрицу г = 


получаем 

1 И 
-х=А Их ь 
И 


что и означает утверждаемое. 


Свойство 4.4. Собственными числами диагональных и 
треугольных матриц являются их диагональные элементы. 


Этот факт легко усматривается из очевидного представле- 
ния характеристических уравнений (4.4) для таких матриц в виде 
п 


Па-а,)=0. 
Е 
Последнее равенство свидетельствует о том, что диагональ- 

ные и треугольные вещественные матрицы имеют только ве- 
щественные собственные значения (ровно пс учетом возмож- 
ной их кратности). Вещественность собственных чисел присуща 
и очень важному в приложениях классу симметричных матриц 
[3, 43]. 


* 
Определение 4.1. Отношением Рэлея`) для пхп- 

Ах, х 

матрицы А называется функционал ри ) 


(х, х) 


деленный на множестве ненулевых п-мерных векторов х. 


‚ опре- 


* < 
Свойство 4.5. Пусть х — собственный вектор мат- 
* 
Рицы А, тогда р(х ) — ее собственное число. 


* 

Для доказательства этого утверждения обозначим через & 

* 

собственное число матрицы А, соответствующее вектору х. 
* ж * 

Подставляя Ах =Д х ввытекающее из определения 4.1 равенство 


(Ах’, х) = р, х°), 


* й 
) Лорд Рэлей (до получения титула лорда — Стретт Джон Уильям, 
1842—1919) — английский физик, один из основоположников теории ко- 
лебаний. 
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имеем 
* * * * * * 
Я |х,х = рх Дх,х }, 
* * 
откуда после деления на В иж )=0 получаем утверждаемое: 
* * 
Я =рх 


Отношение Рэлея обладает рядом других ценных свойств. 
Например, если матрица А — симметричная положительно оп- 
ределенная со спектром Й1>72>й >Й,„, то тах р(х)=Ж, 
шт р(х)=Я„, р(х)Е[1„, | при любых п-мерных ненулевых 
векторах х и, кроме того, ота4 р(х) = 0 тогда и только тогда, ко- 
гда х — собственный вектор матрицы А (см. [3, 141]). Эти свой- 
ства служат основой для некоторых способов локализации собст- 
венных значений и построения градиентных методов их вычис- 
ления. 


В дальнейшем ($ 4.2, $ 4.3) будет полезно следующее экс- 
тремальное свойство отношения Рэлея. 


Свойство 4.6. Минимум евклидовой нормы вектора 
Е(1)= Ах- 7х для любого фиксированного ненулевого век- 
тора х достигается при А = р(х). 


Смысл этого факта в следующем: если некоторый вектор х 
считать приближением к собственному вектору матрицы А (а 
значит, & — его невязкой), то отношение Рэлея р(х) будет наи- 
лучшим приближением к соответствующему этому вектору 
собственному числу в смысле евклидовой метрики. 

Доказательство свойства для симметричных А и вещест- 
венных х весьма просто. Действительно, рассмотрим квадрат 
евклидовой нормы невязки 


|Е(У =(Ах-йх, Ах-дх)= 
=(Ах, Ах)-27(Ах, х)+ 42 (х, х)=а(#), х), 


где 9(1)=^° албан 9 
(х, х) 


член 4(Я) всегда имеет минимум при 1 = р(х), а поскольку 


. Очевидно, квадратный трех- 


(х, х)>0, это значение А доставляет минимум величине ЕСБ, 
и следовательно, величине |5(й}]›. 
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4.2. СТЕПЕННОЙ МЕТОД 


Рассмотрим простейший метод решения частичных проблем 
собственных значений, который вряд ли может быть отнесен к 
широко применяемым методам решения таких задач, но который 
много значит для понимания и построения других, более эффек- 
тивных методов. 

Пусть о вещественной ихи-матрице А известно, что она 
является матрицей простой структуры, т.е. имеет ровно и ли- 
нейно независимых собственных векторов (базис): 


1 Х21 Хт 
№ и Хх 

х! = ы их = — ‚йух, = я (4.6) 
Ми Х2п Хпп 


Пусть нумерация этих векторов отвечает упорядочению соответ- 
ствующих им собственных чисел по убыванию модулей (где пер- 
вое из неравенств — строгое): 


|й > №|>й >|. (4.7) 


Ставим задачу приближенного вычисления наибольшего по 
модулю собственного числа 7, (вещественного, в силу предпо- 
ложения о строгом доминировании его модуля) и соответет- 
вующего ему собственного вектора х| данной матрицы А. 


Возьмем произвольный ненулевой вектор у) и запишем 
его разложение по базису из собственных векторов х|, хо,й ‚хи: 


у(0) =с1х1+62х2+Й +Сихи. (4.8) 


При этом без ограничения общности можно считать, что с1 #0, 
так как в противном (маловероятном) случае можно взять другой 


начальный вектор у`”. 


(0) 


Выполним первую итерацию вектора у 
венства (4.8) слева на матрицу А: 


умножением ра- 


у) = Ау) =С1Ах1+с2Ахо +Й +с,„Ах,. 
Так как А х;} при всех {= 1,2,й ‚ и} по предположению явля- 


ются собственными парами матрицы А ,‚ то, в силу (4.2), послед- 
нее можно переписать в виде 


у) = <1/1х1 +6242х2 +Й +СиАихи- 
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Для второй итерации по тому же принципу получаем 
2 1 2..(0 
у@) — ду@ = А2у©) - 
=сМАх: +С212 Ах) +й +, Ахи = 
=? х1 +2 Ах) +й Зо 
Очевидно, А-я итерация вектора у(®) с помощью матрицы 
А дает вектор 
у = Ау = АК) хной хоч+й +е,Айх, (4.9) 


или, с учетом представления х|, х›,Й ‚х„ в исходном базисе 
(см. (4.6)), 


У 11 51 Хт 
(к) х х х 
у = 7 =" в чад + +2 > 
р й й й 
У® Уп Х2п Хпп 


* 

Беря отношения компонент итерированного вектора’) 

у) к соответствующим компонентам предыдущего вектора 
у 0-9 будем иметь: 


К А А А 
у ) Е йТхи+6242^2: +й Чей — 


Гу 1 К- К 
у ) СЯ Ху+с242 Хой +6Аи в 


К К 
122.182) с в. %ь 


в Е. К. М с хим (4.10) 
Ги т." 
122.24 2% лы 
с хи с хи 


Предел дроби в последнем равенстве при сделанных допущениях 
равен 1 в процессе А >, и значит, > длЯ 
каждого 1Е{1,2,й ‚и}, при котором ху; *0 (заметим, что числа 
ХИ, Х12,Й ‚Хи не могут быть одновременно нулями, так как х] 
— базисный вектор и поэтому не может быть нулевым). 


*) Термин взят из [86]. 
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Представляя вектор у® на основе (4.9) в виде 


сэ [4 р се, [А $ 
у) =с1А# И | ой | щ | (4.11) 
с с 
можно сделать вывод, что при тех же исходных допущениях, В 
А 
силу ма —__>0, В фигурирующей В скобках выражения 


1 (1521) 
(4.11) линейной комбинации векторов х|1,хо,Йй ‚х„ с ростом А 
начнет доминировать первое слагаемое. Это означает, что вектор 
у® от итерации к итерации будет давать все более хорошие 
приближения к собственному вектору х| по направлению, 


т.е. с точностью до скалярного множителя ет (см. свойст- 
во 4.1). 

Таким образом, как показывают приведенные рассуждения, 
метод нахождения «старшей» собственной пары матрицы про- 


стой структуры, называемый степенным методом ), в своей 
основе весьма примитивен и состоит в следующем: берется про- 


извольный — вектор у) (#0), простыми  итерациями 


у = Ау строится последовательность векторов у и па- 
раллельно рассматриваются последовательности отношений со- 
ответствующих компонент векторов К-йи (&-—1)-Й итераций (от- 
ношения с чрезвычайно малыми по модулю знаменателями сле- 
дует игнорировать). Как только установятся несколько первых 
цифр во всех этих отношениях (что выясняется проверкой вы- 


0 Уи 


ЕЕ, И 
Ги Е 
у( ) у ) 


считать, что найдено наибольшее по модулю собственное число с 
точностью, определяемой последним установившимся в отноше- 
ниях знаком, и соответствующий ему собственный невтов, за ко- 


торый принимается последний итерированный вектор у“ 


Для практической реализации такая схема нахождения стар- 
шей собственной пары мало пригодна по многим причинам и 
требует определенной доводки. Рассмотрим некоторые из этих 


полнения приближенных равенств ), так можно 


* 

) Этимология данного термина совершенно ясна. Можно встретить 
и другие названия: счет на установление [78], итерационный метод 
фон Мизеса [87]. Иногда применяют латинскую аббревиатуру РМ (от 
англ. Ромег тешйочл) [141]. 


143 


причин и соответственно пути модификации вышеописанного 
простейшего алгоритма. 


Анализируя выражение у 


в форме (4.11), видим, что при 


достаточно большом числе итераций А за счет множителя рт В 
процессе счета может произойти либо превышение допустимых 
для используемого компьютера чисел, если || >1, либо пропа- 


дание значащих цифр итерированных векторов, если |\1|<1. 


Устранить это явление можно достаточно легко, введя в итера- 
ционный процесс нормировку итерированных векторов (т.е. при- 
ведение к единичной длине по той или иной метрике) на каждой 
итерации или через некоторое фиксированное число итерацион- 
ных шагов. 


Так, пошаговая нормировка векторов порождает следующий 


РМ-алгоритм. 
Шаг 1. Ввести ихи-матрицу А, задать п-мерный векто 
у(0), вычислить о и вектор х(0) .- У ® 
положить А=1. 
Шаг 2. Вычислить вектор у(®) = Ах. 
Шаг 3. Вычислить о] их(® УИ] 


Шаг 4. Вычислить отношения = у [х Ри (координат 


1 
векторов у) и х(—1)) при Е {1,2,й ‚и! таких, что 
(к—1) 
ы 
число (допуск). 
Шаг 5. Подвергнуть числа д тесту на сходимость. 
Если обнаруживается совпадение требуемого числа 
знаков в () и Ра (©) можно задавать произ- 


вольно), то работу алгоритма прекратить и за старшее 
собственное число 11 принять усредненное (по 7) 


| б, где д>0 — некоторое задаваемое малое 


значение 40, а за нормированный старший собст- 


венный вектор х;, — вектор х®. 
В противном случае — вернуться к шагу 2 с А:=А+1. 


Слабым местом данного алгоритма, очевидно, является по- 
следний шаг, т.е. решение проблемы своевременного останова 
работы алгоритма. Этот шаг описан из рациональных соображе- 
ний и не может гарантировать во всех случаях (даже при сделан- 
ных допущениях) получения собственной пары {Я1, х!} с наперед 
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заданной точностью, поскольку при разработке метода не было 
получено никаких оценок погрешности. 
Относительно характера сходимости степенного метода 
можно утверждать (см. формулы (4.10) и (4.11)), что в указанных 
* 


условиях итерационный процесс является линейным ), т.е. схо- 
дится со скоростью геометрической прогрессии, знаменатель ко- 
Я2 
й 
означает, что сходимость будет тем лучше и, как следствие, кри- 
терий останова в шаге 5 тем надежнее, чем сильнее доминирует в 
спектре матрицы А собственное число Й|. Подмеченный факт 
вкупе со свойством 4.2 позволяет существенно ускорить нахож- 


дение наибольшего по модулю собственного числа матрицы А 


путем удачного смещения ее спектра, чему могут способствовать 
**) 


торой определяется в основном величиной отношения ‚ Это 


какие-либо априорные сведения об исходной задаче 

То же свойство 4.2 собственных пар позволяет применять 
степенной метод непосредственно для нахождения наименьше- 
го по модулю собственного числа 7, знакоопределен- 
ной матрицы А в случае, когда наибольшее 11 уже найдено. 
Для этого достаточно найти наибольшее по модулю собственное 
число Л матрицы А-ЛД1Е; соответствующий ему собственный 
вектор этой матрицы и число /„ =Л+1, будут образовывать ис- 
комую собственную пару. 

Действительно, вычитая из верного для собственной пары 


* 
) См. определение 5.1 в $ 5.3. 


#* 

) См. по этому поводу [179, 180]. В [179] приведен пример, на- 
глядно показывающий эффективность подходящего сдвига : если некая 
матрица А шестого порядка имеет собственные числа д ;=21-1, то непо- 


средственное применение степенного метода к вычислению Я порождает 


К 
итерационный процесс, сходящийся со скоростью порядка [5% ‚ в то 


время как сдвиг на величину р=17, оставляющий соответствующее 4] 
число Д|=А-р=3 старшим в спектре матрицы А-рЕ, позво 
ляет найти его степенным методом, сходящимся уже со скоростью 


порядка (2) 
р 3) 
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{1„,х„} равенства Ах„ =Аих„ тождество Я1х„ = Ах, получаем 
верное равенство 
(А-ЖЕ)х„ = (я -М )х„ , 


означающее, что Л:=Й,„-/1 и х, служат собственной парой 
матрицы А-/11Е. Так как для знакоопределенной матрицы спра- 
ведливо неравенство |Й„-11|>|И;—Й!| при любом 1е {1,2,й ‚п}, 
то Л — наибольшее по модулю собственное число матрицы 
А -Л1Е и может быть найдено степенным методом. 

Знание старшего собственного числа Я} матрицы А про- 


стой структуры, получаемого в процессе прямых итераций по 
формулам (4.9), (4.10), в предположении, что 


ий >|, 


позволяет без больших дополнительных затрат найти прибли- 
женное значение второго по модулю собственного числа 4. 


Это можно сделать по формуле 
р р 
лю 
Бы п 
Ул 


Й 


д (4.12) 


вычисляя фигурирующие в правой части отношения для доста- 
точно больших А и для всех Ге {1,2,Й ‚п}, при которых абсо- 
лютная величина знаменателя не меньше некоторого порогового 
значения, и затем усредняя результат. Понятно, что при этом не- 
избежна потеря точности. 

Для обоснования) приближенного равенства (4.12) подста- 
вим в его правую часть выражения компонент (К-+1)-го, А-го и 
(К—1)-го итерированных векторов в соответствии с представле- 


нием (4.9) в исходном базисе. После взаимного уничтожения по 
паре первых членов в числителе и в знаменателе будем иметь: 


* 
) Другое обоснование см. например, в [61]. Там же показано, что за 
соответствующий До собственный вектор х› можно принять нормиро- 


ванный вектор у) — лу. 
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(+1) (К) а Г. К Г: 
т -МУ” 6212 ху-е МАХ ч+Й +с,Ап Хш-с, Аи _ 


2 _ Г. Еф Г. кф 
; - ту. ) сдох 2 хо: +Й Аи -СыАь Хт 


+1 К 
| м, 24) 94) с) хл 
Я, Е де с х 
2 ]= о я и 
= р Г РН 
р м. &А/9Й) с) хл 7 
ложа ТЫ + 2. я 
2 = #2 2 Х21 
та. ВА, о - | | ХО при Вх 
15 2 12 \ 42 Г 


]=З,й ‚п. 

Вернемся к вопросу о недостатках степенного метода нахо- 
ждения наибольшего по модулю собственного числа и путях их 
устранения. При этом далее ограничимся рассмотрением клас- 
са симметричных положительно определенных матриц. И?з- 
вестно, что такие матрицы имеют положительный вещественный 
спектр Ат, 42, й , ди, ортонормированный базис из собственных 
векторов х|, х2,Йй ‚х, и, естественно, являются матрицами про- 
стой структуры. 

Обсудим шаг 4 предложенного выше РМ-алгоритма. 

Вычисление на каждом итерационном шаге отношений 
всех пар соответствующих компонент векторов х и у=Ах, да 
еще с определенными проверками, при больших значениях и 
требует значительных вычислительных затрат, хотя и дает о 
старшем собственном числе | дополнительную информацию: 
как утверждается в [87], значение 1 заключено между наимень- 
шим и наибольшим из этих отношений, т.е. имеются двусторон- 
ние оценки 71 на каждой итерации. 

Чтобы упростить соответствующую шагу 4 РМ-алгоритма 
процедуру, проведем следующие рассуждения. 

Пусть В„ — евклидово пространство, А — симметричная 
положительно определенная матрица и последовательность итери- 


рованных векторов у (®) строится, как и ранее, по формулам (4.9). 


Рассмотрим скалярные произведения (°, у®) и 
(°, у). Выполняя умножение правых частей (4.9) по пра- 
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вилам умножения многочленов и учитывая ортонормированность 
собственных векторов, т.е. условие х»х,)=0, при 


1 ]Е{1,2,й ‚,п}, имеем: 
(о, у® 24242428 +й +62 


пгта э 
((°, у) с? д2А- 14 с2 42 11% +е242%- г 


Отношение этих чисел 
2 2 2 2 
52%) = (=) 
и, С 1 ый 1 
=7 с. Уд, 2 с \2 (д 2 (4.13 
(Е) = (=) 
С1 Я С] Я 


в оговоренных выше условиях при А >50 имеет пределом наи- 
большее собственное число 11, причем скорость сходимости к 
пределу будет больше, чем в степенном методе, опирающемся на 
2 К 


у®), 
у, 


у) 
у 


д 
ЕЕ. против О] |-—= 


1 1 
Базирующаяся на таком подходе модификация степенного 
метода называется методом скалярных произведений. Реализо- 


отношения (4.10) | О 


* 
вать ее можно, например, в виде следующего 5Р-алгоритма ), 


Шаг 1. Ввести: данную симметричную ихи-матрицу А, 
произвольный п-мерный начальный вектор 


у(0) (= 0), малое число &>0 (определяющее допус- 
тимую абсолютную погрешность искомого собст- 
венного числа Д1), число 46) для начального срав- 


нения (например, 0). Положить А=1 (включить 
счетчик итераций). 

Шаг2. Вычислить скаляры 5(0) = (0), у) 
о, = 50) и вектор х(@©) = у) <]. 


Шаг3З. Вычислить у(®) = Ах 1) (итерация нормирован- 
ного вектора). 


* 
) ЗР отангл. Эсаг ргоЧиси. 
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Шаг 4. Вычислить: 5) =0°, у®) и 19 =, хи) 
(скалярные произведения), У“, = \5®, 
х(®) = РИ (приближение к нормированному 


собственному вектору), ДИ = 5 )/ 1) (приближе- 
ние к собственному числу /1). 


Шаг 5. Если | = >=, положить К:=К+1 и вер- 
нуться к шагу 3, иначе завершить работу алгоритма, 
считая Д| = ХО, Хх = х 


Замечание 4.1. Данный алгоритм позволяет более быстро (т.е. за 
меньшее число итераций), чем РМ-алгоритм, найти с нужной точностью 
наибольшее собственное число симметричной матрицы, но при этом 
точность приближенного равенства х|:= х(® для соответствующего 
собственного вектора может оказаться недостаточной (объясните, поче- 


му?). 
Замечание 4.2. Очевидно, в методе скалярных произведений вместо 
отношения (4.13), стремящегося к 71 при А —> 0, можно с тем же успехом 


взять отношение 6 РИ. у®) к (®, у), имеющее тот же предел. По- 
следнее же есть не что иное, как отношение Рэлея: 


отсюда другое название метода скалярных произведений — метод част- 
ных Рэлея. В соответствии со свойствами 4.5, 4.6 предыдущего параграфа 
можно сказать, что этим методом на каждом итерационном шаге ищется 


наилучшее для вычисленного вектора у® приближение к собственному 
числу Я в смысле евклидовой нормы невязки. 


2: — 
Пример 4.1. На матрице ^-( 12 покажем процесс по- 
строения приближений к старшему собственному числу Й1 (и соответст- 
вующему ему собственному вектору х| } методом скалярных произведений. 


Приняв за начальный вектор у(©) первый орт е} = (1; 0)Г, далее 
идем по ЗР-алгоритму. Имеем: 


50-60, у©)-1, |] 9 -, 0-5 ( 
2 


ре © 


149 


1-я итерация: 


од = [| с) |. ") $0 (50, у) 5 


9 =(,0, «©)-2, |], ГИ - 


(1) у $0 
х() — Г = 0 им 20 = — 55—05. 


_ 0.447 /? 92 | 
2-я итерация: 
ба Фь =) 50 - (0, у), 


# 


ыы 5 

ет, род -ру 

ы 0.781 2) 4 
`` Р®.- я. :)* [- р, 5; 


3-я итерация: 


да ъ) $9 (9, ,®)-365 
` т 13 у т 


9-9, х6)-122, |6] = - {555, 


и: Е ВЕ =“, ( ее р 
р. \365 \-13 0.680 /” 8) 122 


По значениям величин |2 - 20 0.429, |) - 2?) = 0.063 можно су- 


) 


дить о сближении последовательных приближений д, (2), 4) собст- 
венного числа 71 с каждой итерацией. Последнюю из этих величин можно 


считать нестрогой оценкой абсолютной погрешности равенства #1 = 8) 
(на самом деле знание ДЛ; =3 показывает его более высокую точность: 


| - 43) = 0.008 < 0.01). Для собственного вектора х| приближенное ра- 
венство х| = х(3) можно оценить величиной 


| - х@)| = [- а =0.073. 
- 0.055] 
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Наличие ортонормированного базиса из собственных век- 
торов х|,хо,й ‚х„ матрицы А позволяет применять степенной 
метод (метод скалярных произведений) для последовательного 
вычисления собственных пар {Я;,х;} при {>2 более совершен- 


ными, чем определяемый формулой (4.12), способами. Рассмот- 
рим один из них. 
Пусть первая (старшая) собственная пара {1,х|} уже най- 


дена, причем ых) =1. Возьмем произвольный ненуле- 
вой вектор 2``” и образуем вектор 


у® = 20 — (#6, хх. (4.14) 


(у, х!)= (7%, х!)- (©, х! )(хт, х1) =0, 


то вектор у(0) ортогонален ху, т.е. его проекция на первый ба- 
зисный вектор системы х|,хо,й ‚х„ равна нулю. Значит, разло- 


Так как 


жение (4.8) вектора у(©) по этому базису имеет вид 
у(©) = СХ +С3ХЗ +й 1Сихи, 


и, соответственно, степенные итерации этого вектора типа (4.9) 
порождают векторы 


у =сдйх +с3 хз + фе Дж. (4.15) 


Легко видеть (сравните с (4.13)), что если |й›|>|Й;| при всех 


2^ 
73 
Е!З,й ‚и, т ——___> >) со скоростью О] |-—^ 
| } у@) у) в” 2 р Г 
у) да 
их® = ——_>х» со скоростью О ы 
р] == 


Следующая собственная пара {Яз, хз} может быть найдена 
приближенно тем же методом, если за начальный вектор после- 
довательности (4 ) ) принять вектор 


у‘ = „(0 - (2, х1 )х1 Е (©, хо)хо, 


ортогональный одновременно х| и х› при любом 20), ит.д. 

Известны и другие способы последовательного нахождения 
собственных пар, опирающиеся на непосредственное примене- 
ние степенного метода. При этом имеются возможности пониже- 
ния размерности при нахождении каждой последующей собст- 
венной пары. 
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Замечание 4.3. В реальных расчетах, в силу неизбежных ошибок 
округлений, в представлении (4.15) итерированного вектора у® при вы- 
числении второй собственной пары появится малое, но растущее с увели- 
чением номера К слагаемое, соответствующее проекции у Ю на первый 
собственный вектор х|. Поэтому реальный алгоритм должен предусмат- 
ривать возврат к началу процесса итерирования, т.е. проведение операции 
ортогонализации по формуле (4.14) с 20) =у(”) через некоторое число 
итераций К=т. 


Замечание 4.4. Не всегда бывает известным, выполняются ли ого- 
воренные выше условия, при которых изучался степенной метод. В таких 
ситуациях при его применении нужно принимать особые меры предосто- 
рожности. Целесообразно, ри контролировать, сближаются ли 


члены последовательности (я посредством проверки неравенств 
ры -1®| < ® _ 1-0 


(прием Гарвика [3, 78]), а также осуществлять итерационный процесс с 
разных начальных векторов (в случае кратности находимого собственного 
числа это просто необходимо для вычисления степенным методом всех 
соответствующих ему собственных векторов). 


Замечание 4.5. Как отмечалось выше, степенной метод сходится 
линейно, точнее, имеет лишь асимптотическую скорость сходимости гео- 
метрической прогрессии. При слабом доминировании модуля вычисляе- 
мого собственного числа эта сходимость может оказаться чрезвычайно 
медленной. Ускорения итерационного процесса можно достигнуть за счет 
быстрого накопления степеней матриц по схеме 


А.А=А?, А?.А?=А“ 
и т.д., что позволяет производить не последовательное, пошаговое, а 


скачкообразное построение последовательности (/“) с помощью ра- 


венств вида 


(К) _ АКТ. (т) 
о ЗА 


при фиксированных т={0,1,й, А-1} (таких, при которых К-т явля- 
ется некоторой целой степенью двойки) и нормированием сразу после 
очередного скачка. Здесь, правда, нужно особенно внимательно относить- 
ся к риску выхода за границы диапазона компьютерных чисел в процессе 
счета. 

Если не требуется находить собственный вектор х|, то более быстро 
вычислять максимальное по модулю собственное число Й| можно на 
основе соотношения [61] 


ЖА +В + =ЗрА* УКЕМ. 
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Вычислив А^ по закону удвоения степеней, а затем А = А* -А, нахо- 
дим отношение следов (сумм диагональных элементов) этих матриц: 


К+1 +1 
де (2) +й +=) 
ЗА _ й Я 


ОЙ 
ЗрАА Г. Г: {>00 
ы д “(22 +Й += 


Замечание 4.6. Более ур способ улучшения сходимости 


степенного метода — это применение 4? процесса Эйткена *) . Считается, 


что если ДО А®, ДУ являются тремя последовательными прибли- 

жениями к собственному числу, полученными степенным методом, то 

число 

в (© _ 4-0} 

ег 
д) 2 1%) + 1-0 


ближе к пределу этой последовательности, чем каждое из них. Этот факт 
может быть использован в реальных алгоритмах либо через несколько 
итерационных шагов (например, через два на третий), либо на завершаю- 
щем этапе вычислений. Для искомого собственного вектора такое ускоре- 
ние может производиться покоординатно. 


4.3. ОБРАТНЫЕ ИТЕРАЦИИ 


В предыдущем параграфе было показано, что при опреде- 
ленных условиях наименьшее по модулю собственное число Д»„ 


может быть найдено степенным методом, когда уже известно 
наибольшее 71. Если же проблема состоит в нахождении лишь 
младшей собственной пары матрицы А, то можно обойтись и без 


вычисления Я › применяя степенной метод к матрице А! 


В самом деле, если данная матрица А имеет собственные 
пары 


тож {42,2 Й , {Аль хил {Я хи, 


то по свойству 4.3 собственными парами матрицы &7 будут 
Е х ео Хх), й а х —. х 
Г .А| р, гл . АГ, ‚ Я . Аи-| Г я ‚Аи 


* 
) Более подробно об этом процессе см. в $ 6.2.1. 
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При этом упорядочиванию спектра А 
> >й >> И 
соответствует цепочка неравенств 


НЫ ый > НЫЕ 


Ая Аи № й 


| 1 1 
для собственных чисел У] :=—>, у =—Й , Уи =— 


Аи Аи М2 | 


1 = 

и НН матрицы А 1. Это значит, что наименьшим по модулю 
1 

собственным числом данной матрицы А является величина, об- 


ратная наибольшему по модулю собственному числу матрицы 
А. Последнее же может быть получено прямыми итерациями 
произвольного начального вектора у(0) посредством матрицы 
А! по аналогичной (4.9) формуле 


у = А 12 (4.16) 
При достаточно больших А е М последовательность отношений 
одноименных координат векторов у) и уб9 должна давать 


1 
приближенное значение — , а вектор у ) (желательно его нор- 


п 
мирование) можно принять за собственный вектор хи. 


Вместо прямых итераций (4.16), требующих предваритель- 
ного обращения исходной матрицы А, обычно предпочитают 


строить ту же последовательность векторов (о) 


К =1, 2, 3, йЙ линейные системы 


‚ решая при 


Ау) =у(0. (4.17) 


Так как все эти системы имеют одну и ту же матрицу коэффици- 
ентов, то самая трудоемкая часть метода Гаусса для их решения 
— ПО-факторизация матрицы А — может быть выполнена лишь 
один раз. 

Построение последовательности векторов, приближающих 
собственный вектор х„ по неявной формуле (4.17), называют 
обратными итерациями, а процесс решения частичных 
проблем собственных значений на этой основе — методом 
обратных итераций ) 


* 
) Другое название обратный степенной метод [29]. 
154 


Применение обратных итераций к нахождению младшей 
собственной пары матрицы А не требует написания специально- 
го алгоритма, достаточно лишь заменить один шаг в алгоритмах 
предыдущего параграфа. А именно, наполнение шага 2 в 
РМ-алгоритме для матриц простой структуры и шага 3 в 
5Р-алгоритме для симметричных матриц должно быть сле- 


дующим: 


решить уравнение Ау(® — у). 


Полученный алгоритм называют ДУ Т: алгоритмом”) 041. 


Метод обратных итераций, а точнее, обратные итерации 
со сдвигами часто применяют в тех случаях, когда нужно с 
большой точностью найти собственный вектор, отвечающий ка- 
кому-либо собственному числу из спектра заданной матрицы при 
условии, что известно приближенное значение этого числа. При 
этом, очевидно, прямое решение однородной системы (4.3) заве- 
домо неприменимо, так как подстановка в нее значения Я, хоть 
сколько-нибудь отличного от собственного, сделает систему од- 
нозначно разрешимой, т.е. допускающей только тривиальное ре- 
шение. Рассмотрим суть обратных итераций со сдвигами. 

Пусть для собственного числа Я; матрицы простой струк- 


туры А известно его приближение о’ такое, что 
|й; <<: -0] У1=), (4.18) 
т.е. число ©’ ближе к собственному числу 7 ;, чем к какому-либо 


другому собственному числу матрицы А. 
Начиная с вектора х`’” такого, что =, образуем 


последовательность нормированных векторов х(0) по формулам 
(А-сЕ)у® = х- 1, (4.19) 
х(®) =У® ув, К=1,2,й. (4.20) 


Изучим поведение этой последовательности, для чего запишем 
разложение векторов у) и х 9 по базису из собственных 


* 
уе англ. /иуегзе пегайоп. 
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векторов х|, х›,й ‚, х,„ с некоторыми коэффициентами с ®) и 


ые- соответственно: 


у = Ох, +с®х, +Й чех», (4.21) 


х(-П = Ох +5 Ох, +й +6 Ох,. 
Подставляя это в (4.19) и учитывая, что по определению 
Ах; =дДх; У {1,2,й ‚п}, 
имеем 


(Я —в)с 9х +(%> -в)е ух, +й +(Я» сс х„ = 


=, +5 0х, +й +5 Хх, 
откуда, в силу единственности разложения вектора по базису, 
следует 
(1-о)е® = е,2,й ‚п. 
Анализируя получающиеся отсюда выражения 


К—1 

(© _ вв 

” Я; —167 
(К) 

коэффициентов разложения вектора у““’ по базису из собствен- 

ных векторов, видим, что вследствие малости модуля знаменате- 

ля 1; —с по сравнению с другими знаменателями Д;-б 


(см. (4.18)), можно рассчитывать на преимущественное возраста- 


(4.22) 


К 
ние коэффициентов с ) именно при собственном векторе х; с 


ростом К. Значит, чем сильнее неравенство в (4.18), тем сильнее 
(быстрее) будет доминировать составляющая собственного век- 


тора х ; в представлении (4.21) вектора у“ 1, а значит, и вектора 


х(®, получаемого из у) нормированием (4.20). Последнее же 
говорит о том, что каков бы ни был начальный вектор х(0) 


* 
(= 0) ), быстрое доминирование 2% среди остальных коэффи- 


циентов с ) происходит еще и за счет числителей дробей (4.22). 


* 
) Лишь бы при его выборе не попасть на ортогональный Хх, вектор; 


зачастую берут вектор х(0) с равными координатами. 
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Следует заметить, что обратные итерации со сдвигами 
(4.19), (4.20) позволяют не только найти собственный вектор х 7 
но и служат основой для уточнения приближенного равенства 

Действительно, формулы (4.19), (4.20) определяют не что 
иное, как метод обратных итераций для нахождения наименьше- 
го по модулю собственного числа матрицы А-оЕ, и, если д 
существенно ближе к Д;, чем к любому другому собственному 
числу 7; матрицы А, то уточняющие Х, значения, согласно 


свойству 4.2, можно получать при А =1, 2, й по формуле 


Х 
О =о+(-——), (4.23) 
< 
У; 
где хи и У@®) — координаты векторов хи у) соответ- 


ственно, а (-) — знак усреднения по всем 1 е {1,2,й ‚п}, при ко- 
торых у #0 [78]. 

Как показывает практика вычислений, сходимость процесса 
обратных итераций со сдвигами характеризуется высокой скоро- 
стью (по сравнению с обычным степенным методом). Но еще бо- 
лее быстрая сходимость может быть получена введением пере- 
менных сдвигов, определяемых какой-нибудь последовательно- 
стью чисел од, 01, б2,й , сходящейся к находимому собствен- 


ному числу. Не вызывает сомнений целесообразность использо- 
г К 

вания в роли таких чисел приближений Ж к собственному чис- 

лу 7 ;, получаемых по формуле (4.23). 


Таким образом, обратные итерации с переменными сдви- 
гами можно определить совокупностью равенств 


[И 19 0, 
х(® = у) у (|, дэ 


(К (0 о бы 

К = 1 

д =1; + А 
У 


где А =1,2,й ‚ а число я (= й;) и вектор х(0) (такой, что 


ко] = 1) задаются. 
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Скорость сходимости процесса (4.24) — квадратичная [43, 
78], в то время как в случае постоянных сдвигов — лишь линей- 
ная, хотя и с малыми, как правило, знаменателями геометриче- 
ской прогрессии. Зачастую бывает достаточно сделать 2-3 итера- 
ции по формулам (4.24), чтобы получить заданную собственную 
пару с реально возможной точностью. Нужно только видеть раз- 
ницу в цене реализации обратных итераций с постоянными и с 
переменными сдвигами: в первом случае при каждом А решают- 
ся линейные системы с одной и той же матрицей коэффициентов 
(как это было и при обратных итерациях (4.17) без сдвигов), во 
втором случае на разных шагах приходится решать совершенно 
различные системы. 

В методе (4.24) также, как и в предыдущем, неясно, как 


подбирать начальный сдвиг “=7 ‚› за исключением случаев, 


когда решается частичная проблема заведомо в такой постановке, 
при которой требуется найти собственное число, ближайшее к за- 
данному значению, и соответствующий ему собственный вектор. 
Более определенной в этом смысле, к тому же более быстро 
сходящейся является следующая модификация метода (4.24) — 
обратные итерации с отношениями Рэлея, применяемые для 
решениясимметричных задач на собственные значения. 


Ее основу составляет ВОТ-алгоритм): 
Шаг 0. Задать вектор х(0) такой, что | | =. 
Шаг1. Для К=,2,й : 


1.1. Вычислить ру =(Ах@ О, х(% < О, х( Ц, 
(к) 


1.2. Найти у““” из уравнения (А-рьлЕ)У® =, 


1.3. Нормировать у®, т.е. положить х(® =У® у]. 


1.4. Проверить ру, х(®) на сходимость. Перейти на 


шаг 1.1 или остановиться. 
ЖЖ 
После «штатного» останова работы алгоритма ) при неко- 
тором А = Ко в качестве собственной для данной матрицы А объ- 


является пара Рь х) } или делается еще шаг 1.1 и берется 
(Ко) 
р, х ы } 


* 
) КО! — Аауеюй диойеи пегайоп (англ.). 
#* 
) Один из вариантов останова: ]ьс, где С>0 — большая 
константа [141]. 
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Сдвиги на отношения Рэлея при наличии ортонормирован- 
ного базиса из собственных векторов х|, хо,й , х„ обеспечивают 
асимптотически куичВекио скорость сходимости последова- 
тельности Рэлея х(0), х м х(2) р к некоторому из векторов 
этого базиса [43, 141]. К какому именно, зависит от выбора на- 
чального вектора этой последовательности; беря различные ли- 
нейно независимые векторы х(0), можно получать разные собст- 
венные пары данной симметричной матрицы А. При этом, прав- 
да, без дополнительных условий (типа (4.18) применительно к 
ро в роли ос) нельзя гарантировать, что найденное как предел 
последовательности ро, р1, р2,й собственное число будет бли- 
жайшим к числу ро. 

Чтобы если не обосновать, то хотя бы осмыслить КО]- 
алгоритм, нужно вспомнить свойство 4.6, согласно которому, 
при выбранном векторе х °) вычисленное на первом шаге при 
К=1 отношение Рэлея ро = Ах(©), х(0) у/х<©), х 0) можно счи- 
тать некоторым приближением к собственному числу, связанно- 
му с заданным в А,„ направлением х(0)С этим начальным при- 
ближением к какому-то собственному числу й ; далее выполня- 
ются обратные итерации с переменными сдвигами, как ив (4.24), 
только приближения к А ; находятся не через отношения коорди- 


нат векторов у(®) и х4-й. а через отношения Рэлея (как в методе 
скалярных произведений, см. замечание 4.2 в $ 4.2), причем по- 
скольку здесь р, приближает собственное число данной мат- 
рицы А, а не «сдвинутой», нет необходимости корректировать 
получаемое значение на величину смещения спектра, что имело 
место в формуле (4.23) и в последней из формул (4.24). 


Замечание 4.7. ВО]-алгоритм допускает использование любых век- 
торных норм. Более естественно здесь применение евклидовой нормы; в 


таком случае, в силу КЗ, =>, «5-1, вычисление р/_ 


можно производить по формуле 
РЕ = (4х, х@-0). 


Замечание 4.8. Ясно, что применение переменных сдвигов в методе 
обратных итераций сильно ухудшает от шага к шагу обусловленность 
матриц решаемых там СЛАУ (они быстро приближаются к вырожден- 
ным). Однако, как показали проведенные Уилкинсоном [179] исследова- 
ния, это не сказывается на достижимой точности получаемых таким мето- 
дом результатов. Более того, Парлетт [141] аргументировано утверждает 
полезность плохой обусловленности (редкий случай!) матриц линейных 
систем в методах обратных итераций с хорошими сдвигами; объяснением 
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этому парадоксальному явлению служит сосредоточение ошибок округле- 
ний именно в направлении искомого собственного вектора, что только ус- 
коряет доминирование нужной составляющей. 


2—1 
Пример 4.2. К симметричной матрице ^-( ,] из приме- 


ра 4.1 применим ВО1-алгоритм. 


3 0.6 
Примем за начальный вектор (3 :| с нормой 
5 | 


| Зи = У, х(0) А-1 и посмотрим, как поведет себя процесс обрат- 


ных итераций с отношениями Рэлея (которые, в силу замечания 4.7, будем 
подсчитывать по упрощенной формуле). Следуя алгоритму, последова- 
тельно получаем: 


0.4) (0.6 
= (Ах) х©))- —1.04: 
= (А = = 1.04; 
ро= (я, х) ( 1 } [оз] 


(0 
дер в 0.96’ 55 '=05, _ А) 
- 70 + 0.960 = 0.8 —17.448980 


[У], = 24-78843, х@ = у | 


Пр Ео-тозоаз 
далее при К =2 аналогично имеем: : 


« _@)\_((-0.713288®) (-0709165 
ри = (Ах, х ©). =1.000018; 
- 0.700921)” (— 0.705043 


39283.201 
(А- рЕ)у@) =х® = ) 


39283.203 
(2) 0.70710674 
|2], =55554.4, х@) = потннть) 


Вектор х(2) и скаляр ро = ( х(2), х(2) 0.99999994 с высокой точностью 
представляют младшую собственную пару (12, х> } данной матрицы А. 

Кроме предсказанной высокой скорости сходимости метода, обра- 
тим внимание на быстрый рост здесь величин У], что, как ранее под- 
мечено, можно положить в основу критерия окончания итерационного 
процесса. Использование одного естественного критерия |рх — р 1|<= в 
некоторых случаях может подвести по причине зацикливания. Чтобы убе- 
диться в этом, достаточно провести в условиях данного примера про- 
стейшие, буквально устные, вычисления, начинаемые с вектора 
х(0) = (0; тг. Подчеркнем, что выбор начального вектора в данном мето- 
де играет весьма существенную роль. 
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4.4. МЕТОД ВРАЩЕНИЙ ЯКОБИ РЕШЕНИЯ 
СИММЕТРИЧНОЙ ПОЛНОЙ ПРОБЛЕМЫ 
СОБСТВЕННЫХ ЗНАЧЕНИЙ 


Дальнейшее изучение методов решения алгебраических 
проблем собственных значений существенно опирается на мат- 
ричное преобразование ба Напомним, что подобными на- 


зываются матрицы А и В=С` ТАС, где С — произвольная не- 
вырожденная матрица. 

Пополним приведенный в $ 4.1 набор простейших свойств 
собственных пар матриц еще двумя свойствами. 


Свойство 4.7. Пусть {1, х} — собственная пара мат- 


рицы В =СТАС. Тогда {Я, Сх} — собственная пара мат- 
рицы А. 


Чтобы убедиться в справедливости этого свойства, доста- 
точно подставить выражение В =СТАС в верное для пары 
{Й, х} равенство Вх = йх: имеем СТАСх= ях, откуда после ум- 
ножения слева на матрицу С получаем равенство АСх = ХСх, 
означающее истинность утверждения. 

Как видим, иреобразование подобия сохраняет неизменным 
спектр любой матрицы. 


Свойство 4.8. Пусть А — пхи-матрица простой 
рН (см. $ 4.2), а матрицы А=@ае(7;) и 
= (х1; хо; й;х,) образованы из ее собственных чисел и 
ыы векторов соответственно. Тогда справедливо 


равенство А=Х` ТАХ. 


Действительно, то, что {Я;, х;} являются собственными па- 
рами матрицы А, означает, что 
Ах; =Х;х; УЕ 2,Й ‚п. 


Эти и равенств могут быть записаны в виде одного матричного 
равенства 


АХ = ХА. (4.25) 
В силу простой структуры А, все ее собственные векторы, т.е. 
столбцы матрицы Х, линейно независимы, поэтому матрица Х 
обратима. Умножив равенство (4.25) слева на матрицу т по- 


лучим нужное представление А = Х 'АХ. 
Так как для диагональной матрицы А, образованной 
из собственных чисел, собственными векторами могут служить 
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единичные векторы исходного базиса (действительно, 

=1:е; УЕ Й,2,й ‚,п}), то применяя к последнему случаю 
свойство 4.7 с С=Х исх=е; (т.е. с Сх= Хе; =х;), приходим к 
другой формулировке свойства 4.8: 


если {1;, е;{ является собственной парой матрицы 


А=91а°(1;)=Х (АХ, то {1., х;} есть собственная пара 
матрицы А (обозначения те же, что и в свойстве 4.8). 


Далее (в пределах этого параграфа) будем рассматривать 
только симметричные вещественные матрицы. Поль- 
зуясь известным фактом о наличии у таких матриц полной орто- 
нормированной системы собственных векторов, т.е. тем, что за- 
явленная выше матрица Х из ННННЫ векторов в этом слу- 
чае является ортогональной (Х` в. =Х7 ), запишем как следствие 
свойства 4.8 равенство 


А=ХГАХ. (4.26) 


Значит, для всякой симметричной матрицы А найдется диаго- 
нальная матрица А, ей ортогонально подобная. Вопрос теперь 
состоит в том, как реализовать хотя бы приближенно равенство 
(4.26), которое позволило бы найти сразу все собственные числа 
матрицы А (элементы диагонали матрицы А) и все соответст- 
вующие им собственные векторы (столбцы матрицы Х)? Один из 
возможных ответов на этот вопрос состоит в применении к А 
последовательности однотипных преобразований, сохраняющих 
спектр и приводящих в пределе данную матрицу к диагонально- 
му виду. 

Для этих целей будем использовать преобразования с по- 
мощью так называемой матрицы плоских вращений 


в: ры | ы 2 давл 


0: =] 


Она получается из единичной матрицы заменой двух единиц и 
двух нулей на пересечениях 1-х и /-х строк и столбцов числами 
си +5, как показано в (4.27), такими, что 


с? +52 =1. (4.28) 


162 


Условие нормировки (4.28) позволяет интерпретировать числа с 
и 5 как косинус и синус некоторого угла <, и, так как умножение 
любой матрицы на матрицу Т,, изменяет у нее только две строки 
и два столбца по формулам поворота на угол @ в плоскости, оп- 
ределяемой выбранной парой индексов Ги /, то это полностью 
оправдывает название матрицы Т,,. 


Матрица Т, ортогональна при любых 1, /Е{1,2,Й ‚и} 
(проверьте!), и значит, матрица 


В=ТУАТ, (4.29) 


подобна А, т.е. имеет тот же набор собственных чисел, что и 
матрица А. 

Классический итерационный метод вращений, предло- 
женный Якоби (1846 г.), предполагает построение последова- 
тельности матриц 


Во(= А), Вт, В, й ‚Вр, й 
с помощью преобразований типа (4.29) 


78 
В; = т, ВТ, (4.30) 


такой, что на К-м шаге обнуляется максимальный по модулю 
элемент матрицы В;_| предыдущего шага (а значит, и симмет- 
ричный ему элемент). Эта стратегия определяет способ фиксиро- 
вания пары индексов р, Уз задающих позиции 
(1,0, Л, @,7,(,17) «существенных» элементов в матрице 
вращения Т,,, и угол поворота &, конкретизирующий значения 
этих элементов с=с0$“ и +5=+зта. На каждом шаге таких 
преобразований пересчитываются только две строки (или два 
столбца, что неважно в силу симметрии) матрицы предыдущего 
шага. Хотя, к сожалению, нельзя рассчитывать, что таким путем 
за конечное число шагов можно точно найти диагональную мат- 
рицу А ‚, ибо полученные на некотором этапе преобразований ну- 
левые элементы на следующем этапе станут, вообще говоря, не- 
нулевыми, но нужное предельное поведение 
В, ——_>^, 
К—>о 

как будет показано ниже, есть. 

Определив идею метода вращений, рассмотрим теперь его 
несколько подробней. 


Пусть А= (аи ‚1 — Исходная симметричная матрица, а 


в=(ь матрица, получающаяся после одного шага 


тт, [= 
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преобразований по формуле (4.29). Обозначим соответственно 
— — * 


через А и В двумерные подматрицы этих матриц ), определяе- 
мые фиксированием позиции (7,7) некоторого элемента а; мат- 


у 
рицы А: 
= ай а’ В — Ь; | 
— ) > , 
ау ау т Бу 


а через Т — такую же подматрицу матрицы Т;: 


— ©: —9 
Т= р 
$ в 
Очевидно, что равенство (4.29), записанное для матриц 


А, В, т,, 


этим, подсчитаем элементы матрицы В, выполняя умножение в 
правой части двумерного аналога (4.29): 


будет верным и для их подматриц А, В,Т. Пользуясь 


> те с 5) Сай + 5аг саг - 5ап 
В=ТГАТ= т 9 = 
—яс саг + 54 | са у - 5ау 
с?ад +2сзау +5?а} с?ау — с5ац + с5а -52ар 
с?ау —сзаз +сзау -5ар са —2езау +5та:: 


Отсюда видим, что Б; = Б =0, если 


(2 52а; 


с5(а;; аз)=0, 
т.е. если 
$ _ 
2-х р 


Учитывая тригонометрическую интерпретацию чисел 
с=с05а и $=зта , в соответствии с чем можно считать 


5ш2а 
65= о 62—52 =с052а, 


* р 
) ВА элемент а; сразу заменяем равным ему элементом ау, с ра- 


венством же В, =Ь; в В пока не торопимся. 
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приходим к выводу, что матрица В будет иметь нулевые внедиа- 
гональные элементы Б;, =Ь ;;, если использовать преобразование 


плоского вращения по формуле (4.29) на угол а такой, что 


пл 
(для определенности считают @Е (-^. я ). 


Ясно, что нет необходимости находить непосредственно 
угол & , поскольку нужные для выполнения преобразований чис- 
ла с и 5 можно получить через значение {е2а по формулам три- 
гонометрии. При этом сразу отметим, что наибольшие требова- 
ния к точности в описываемом методе предъявляются именно на 
стадии вычисления с и $5, так как здесь возможны наибольшие 
потери точности, а искажение с и 5 нарушает ортогональность 
матриц Т, что ведет к неустранимым погрешностям (метод вра- 
щений, итерационный по форме, не является итерационным по 
существу: ему не присуща самоисправляемость методов после- 
довательных приближений). 

Проделав соответствующие элементарные выкладки и воз- 
вратившись к и-мерному случаю, запишем теперь совокупность 
формул, определяющую один шаг метода вращений Якоби. 
Для того чтобы не перегружать эти формулы лишними индекса- 
ми, будем считать что преобразуется матрица А в матрицу В со- 
гласно (4.29), хотя на самом деле на К-м шаге должно приме- 


(1) 


няться преобразование (4.30) к матрице В; _| = 5“ ) с резуль- 
татом Ву 6). 


т/ 


Итак, пусть а; — ключевой элемент преобразуемой мат- 


рицы А. Матрица В, подобная А, формируется следующим 
образом: 


1.Вычисляют р:= 2ау, а=а-ау, а = ур” +47 . 


2. Если 4=0, то ":=|9|/(24), с=\0.5+г, 


5:=50.5-".910п(ра) (если |р]<<Ч, то лучше 


5=|р-меп(ра)/(2са)), 
если же 4=0, то е=5:=52/2. 
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3.Вычисляют новые диагональные элементы: 


ой 2 
Ь: к # Ар +5 а} +2сзау, 


22 2 — м 
Бу :=5 ац+с‘ ау -2сзау. 


4. Полагают 5;; =Б ; :=0 (или для контроля вычисляют 


Б; =бл = [22 5? +с5а -а,)} р 
5.При т=1,2,й ‚и таких, что т=1, т» ], вычисляют из- 
меняющиеся внедиагональные элементы: 
Бух = бы Е 5ату» 


(4.31) 
Ь т = Вт = 5а: + Сат р 


6.Для всех остальных пар индексов т,[ принимают 
Би = ат. 


Конечно, в реальных вычислениях, если это считать осно- 
вой алгоритма, не все записанное здесь следует выполнять, а 
именно, не нужно делать последних переприсвоений, а также 
должна учитываться симметрия получающейся матрицы В. 

Убедимся теперь, что если в качестве ключевого или, в иной 
терминологии [141], обреченного элемента на каждом шаге 
преобразований подобия по указанным формулам брать макси- 
мальный по модулю элемент преобразуемой матрицы, то в пре- 
деле получится диагональная матрица. 

Для доказательства этого, т.е. доказательства сходимости 
последовательности (В; ) к А, используем (см. приложение 1) 


норму Фробениуса 


И 
2 
ха о 


и 


[А[ = 


Проследим за поведением норм матриц (точнее, квадратов 
этих норм), получающихся из матриц Ву заменой диагональных 
элементов нулями. Такие матрицы, определяемые внедиагональ- 
ными элементами матриц В,, будем обозначать Ув, . При этом 


опять для упрощения записей будем пока рассматривать переход 
ОТА кВ. 
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Найдем выражение суммы квадратов внедиагональных эле- 
ментов матрицы 


ай БЕЙ Ы,Й ам 


/ 


Ч 1 й Ви; й Би, й Чип 


принадлежащих изменяющимся по сравнению с А строке Г и 
столбцу /, через элементы матрицы А. Имеем (с учетом (4.31), 


(4.28) и условия обнуления элементов Б;, =Б;): 


КУ! +52, = У(?а2, +2 сзатату +5?а у 


т т=] ТЕГ, ] 
++ 5? = -2езатату +с?а?, +53, = 
Т-, 1 
2 2 2 
= У? +5 + [22 +5 2, |= Уи +} 
т, ] т, ] 


Аналогичные суммы квадратов /-й строки и 1-го столбца, в 
силу симметрии, дадут такое же выражение. Это означает, что 
если полученное равенство удвоить и дополнить левую и правую 
части суммой квадратов всех остальных внедиагональных эле- 
ментов матрицы А (служащих соответствующими элементами и 
матрицы В), то в левой части будет стоять сумма квадратов всех 
внедиагональных элементов матрицы В, а в правой части — 
сумма т - всех внедиагональных элементов матрицы А, 


кроме а и ар . Следовательно, справедливо равенство 
2 2 
[Ув =ПМл|х —2а7, (4.32) 


говорящее об убывании сумм квадратов внедиагональных эле- 
ментов в рассматриваемом процессе преобразований подобия. 


Пусть [ау|= = пах [аш }. Тогда можно считать, что 
т 
ау = тах 2} не меньше, чем среднее значение множества из 
т= 1 
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п? —и квадратов всех внедиагональных элементов и-мерной 
матрицы А, т.е. вличины 


| 2 1 
а = 
п(п-1) и "о и(и-1) 
2 1 
‚Е. ВИА 
У и(и-1) 


2 
Уд. 


Подставляя полученную оценку а Ул |. в равенство 


(4.32), приходим к неравенству 


2 2 2 
Мы < мА 


На основании этого для последовательности матриц Ву, пред- 
ставляемых в виде 


В; = аа ® }+ Ув, , 


можно записать: 


р) 
Пу < (1-м 5 = 


К 
< [ >) ИУдВ — — 50. 

п(и-1) Ао 
Значит, при указанном способе выбора ключевого элемента по- 
следовательность подобных матриц В ; сходится к диагональной 
матрице А из собственных значений, по крайней мере, со скоро- 
стью геометрической прогрессии. 

Описанный выше классический вариант метода вращений 
Якоби, как показывают более тонкие оценки, на самом деле име- 
ет асимптотически квадратичную скорость сходимости [42, 141, 
179]. Однако при больших размерностях и его реализация натал- 
кивается на существенные потери машинных ресурсов, связан- 
ные с поиском наибольшего по модулю ключевого элемента. По- 
этому чаще применяется более медленно, но все-таки тоже асим- 
птотически квадратично сходящийся циклический метод Якоби 
с барьерами. Стратегия выбора ключевого элемента здесь тако- 
ва: устраивается циклический перебор всех над- или поддиаго- 
нальных элементов матрицы А (точнее, В,_1) для их использо- 


вания в роли обреченного, но при этом пропускаются элементы, 
абсолютные величины которых меньше некоторого заданного 
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положительного числа — барьера. Этот барьер может быть пе- 
ременным (уменьшающимся по какому-либо осмысленному 
принципу). 

Следует отметить успешную работу таких итерационных 
процессов и в случаях, когда исходная матрица имеет кратные и, 
что хуже, близкие собственные числа. 

В завершение, остается вспомнить, что в соответствии со 
свойствами 4.7, 4.8 и проведенными рассуждениями за собствен- 
ные векторы х|,х›,Й ‚х,„ матрицы А (имеющие единичную 
евклидову норму) могут быть приближенно приняты столбцы ре- 
зультирующей матрицы, получающейся справа от А в цепочке 
преобразований подобия 


_ Г 
В! = т, Л АТ з 
_ ВР кт 
В› =Т, ВИА =Т, /Т, „АТ Тл ь 
_ Г Т 
Вь= т й Та АТ Т, 


т.е. матрицы 

ть = Тк Та л п тт 
при некотором А=К. Разумеется, в реальном вычислительном 
процессе нужно обойтись без матричных умножений. 


Сигналом для окончания процесса вращений Якоби может 


служить, например, достаточная малость |Ув, | или |5 Е 


Пример 4.3. Методом вращений Якоби решим задачу нахождения 

113 

всех собственных пар матрицы А =| 15 1 

311 
К данной симметричной матрице А (не знакоопределенной) 
будем поэтапно применять записанный выше основной фрагмент алго- 
ритма, переводящий ее в матрицу В, являющуюся подобной А и имею- 
щую меньшую сумму квадратов внедиагональных элементов. При этом 
условимся, что ключевой элемент а, будем брать в поддиагональной час- 


ти матрицы А (можно и наоборот, ничего от этого принципиально не из- 
менится) и что все вычисления будем проводить точно (т.е. рассматрива- 
ется идеальный процесс). 

Этап 1-й. Выбираем ключевой элемент аз! =3 (максимальный в 
условленной части матрицы), следовательно, фиксируем индексы 1=3, 
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1=1. Вычисляем 


1 
р=2аз1=6, а=азз -а1=1-1=0 => с=5=—=. 
3 33 ИС 
Далее находим элементы новой матрицы 
1 1 1 
уз = с’азу +5 аи + 05а =5.1+5.-1+2.5..3=4, 
1 1 1 
1 =52а33 +с?аи —2сзаз1 =5>1+5..1-2-5.3=—2 


и при т=2 


Ь32 = оз = Сазз + 5а21 == +1)=2, 


1 
Бо =В51 =-5а5з + са === (-1+0=0. 
12 =521 а Г 
Следовательно, данная матрица А подобна матрице 
-2 0 0 
в=| о 5 +2. 
о 2 4 


Этап 2-й. Полученную на предыдущем этапе матрицу В считаем 
матрицей А, т.е. будем считать по тем же формулам, положив А:=В. 


Ключевой элемент здесь аз2 =\2, те. 1=3, 1=2. Согласно алгоритму, 
имеем: 


р=2аз2 =2\2, 4 = азз - а22 =4-5=-1 (замечаем, что ра < 0), 


а=\р” +а? =/8+1=3, ‚М1 


24а 6’ 

В. 2 ЯН 2 
=\0.5+и=.|-+-—=—, =\0.5—к- 51 А, 
С=У г \Ь би 5 г: $121( ра) \Ь т 


Зная числа с и 5, определяющие преобразование вращения, вычисляем 


4..8 тг 
БЕ Я В ЕВ д ./2=3, 
33 33 22 32 6 р: к 


% 
2 - 
[#2 =52азз +с?а — 265а32 5+6 


и далее при т=1 


В = з = СИ + 5а12 = [-32 0-0, 


\6 \6 
621 =512 = —5Аа13 + са = 042.050. 
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Таким образом, уже после второго этапа (это не норма, а, будем 
считать, везение) получена диагональная матрица 


—2. © 0 
В= 060, 
003 


подобная исходной матрице А, в силу чего можно утверждать, что собст- 
венными значениями матрицы А являются числа 
Й=-2, #2=6, Ж=3. 
Чтобы найти отвечающие им собственные векторы, выпишем мат- 
рицы плоских вращений первого И второго этапов (в соответствии с их 
структурой (4.27)) 


1 | 
(1) (1) ЯР 
ь с 0$ И И 
=. =| © 10:0 10, 
ея () () 1 Й 
—%5 0} че и 
2 2 
о о 
о 0 
ТЯ =тр=0 с® |= 0 = -й | 
0 —52) с@) у а 
ГЕ 
\%6 +3 


51- 51° 51 
НЫ 


согласно последним теоретическим выкладкам этого параграфа, имеет 
своими столбцами собственные векторы матрицы А. Легко проверить по 
определению, что ее столбцы в естественном порядке, т.е. векторы 
1 1 1 
1 1 1 
х === 0], ж=—|2|, = 
\/2 6 

—1 1 1 
образуют собственные пары с числами Д=-2, 142=6 и 43=3 
соответственно. 
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4.5. ПОНЯТИЕ ОБ 1О-АЛГОРИТМЕ 
ДЛЯ НЕСИММЕТРИЧНЫХ ЗАДАЧ 


Чаще (по крайней мере, в несимметричном случае) алго- 
ритмы приближенного решения полных проблем собственных 
значений основываются на приведении данных матриц к подоб- 
ным им матрицам не диагонального, а треугольного вида. Наи- 
более простой из таких алгоритмов вычисления собственных чи- 
сел опирается на хорошо известное Г-разложение матриц (см. 
гл. 2). 

Пусть данная ихи-матрица А представлена в виде А =ГО, 
где Г и Ч — соответственно нижняя и верхняя треугольные мат- 
рицы. 

Обозначим") А/ := ОГ, тогда Ч =А И. Подставив это вы- 
ражение матрицы Ч в равенство А = О, получаем новое пред- 
ставление А: 

А=ГА Г", (4.33) 
которое говорит о подобии матриц А и Ау, т.е. о равенстве их 
собственных чисел Яд и Яд. . 

Если матрица А| может быть, как и А ‚ представлена в виде 
произведения нижней № и верхней Ш; треугольных, т.е. 
А = 91, то, положив А_›:=ЧИл и выразив отсюда 


1 = Ао, аналогично предыдущему получаем 
А! = АЛ, (4.34) 


Следовательно, А} подобна А› и ‚значит, ЛА, = АА, . 


Суперпозиция этих двух преобразований, т.е. подстановка 
(4.34) в (4.33), дает выражение А через А_: 


А=МА ЛИ! = ААА (1Л) 1, 
непосредственно утверждающее равенство собственных чисел 
ЯА И ЛА): 

Такой процесс построения теоретически бесконечной по- 
следовательности подобных матриц и составляет основу ЁО- 


** 
(иначе, СК-) алгоритма ). Он определяется фактически двумя 
формулами: 
*) 
Напомним, что произведение матриц, вообще говоря, некоммута- 
ТИВНО. 


** 
) Алгоритм предложен Рутисхаузером (1958 г.). 
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А; =ЕО,, Ан =ОИ, (4.35) 


где Ау:=А, К=0,1,2,Йй , причем первая из этих формул означа- 
ет процедуру треугольной факторизации матрицы Ау на К-м 
шаге, а вторая — простое умножение верхней треугольной мат- 
рицы на нижнюю. 

Доказано [138, 179], что при ряде ограничений на данную 
матрицу А (простейшим из которых является, в частности, тре- 
бование, чтобы все ее собственные числа были различны по мо- 
дулю) итерационный процесс (4.35) осуществим, и формируемая 
им последовательность (А’) сходится к треугольной матрице 
вида 


м * *Й * я 0 01 0 
0 12 *Й * * 2 0Й 0 
или вида 
00 0 д, . * *Й АД) 


в зависимости от того, фиксируется единичная диагональ при 
[Л /-факторизации у матрицы № или у Ч соответственно 
(см. $ 2.3). К сожалению, эти ограничения трудно назвать конст- 
руктивными, и реализующие [О-алгоритм программы больше 
опираются на эмпирику. Осуществимости, устойчивости и уско- 
рения сходимости процесса (4.35) обычно добиваются (если это в 
принципе возможно) путем подходящих сдвигов матриц и пере- 
становок их элементов; соответствующие исследования и реко- 
мендации по этому поводу можно найти в [179]. 


Пример 4.4. Рассмотрим, как ведет себя ГО-алгоритм (4.35), при- 


21 
мененный к нахождению собственных чисел матрицы А-[ 1 < 
м 


Выполнив [О-разложение ›^, получим 


2 01 0.5 
Ао:-=А=В000 = 6 —2 . 


1 
*) формулам из $23  [;=а,- Ущик (>), 
К=1 


1 = а 
и, = т“ — ими (1< /), используемым поочередно. 
й К=1 
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Перемножая матрицы 1 и О в обратном порядке, строим матрицу 
И 
т 


Факторизуя эту матрицу аналогично предыдущему, имеем 


5 0 \! -02 
И 


3.8 0.16 
б —08/ 


откуда 


А> = ОИ -( 


Следующий шаг дает 


Гари -(* 0 | ры 
в а ГР 


4.0526... 0.0443... 
43 =10212=| 6 10526. 


Как видим, диагональные элементы матрицы А отличаются от точных 
значений собственных чисел | =4, 42 =-1 на 0.2, а матрица Аз позво- 
ляет указать значения АД] и 42 с погрешностью = 0.05. 

Если в этом же примере фиксировать единичную ДивгОНяЛЬ у мат- 


). 


риц Ё» ,‚ то процесс (4.35) будет развиваться следующим образом 


а 102 1 > о 5 1 
А=ВоОо = 3 1)0 —2 $ А; := Чо = 6-2 ; 


ога - | НЕ | 
556. Аб 10026 


$дог [ 40526... | 
Е | бай 50. 


Диагонали матриц Ах и Ах, несущие приближения к собственным 
числам А, при одних и тех же значениях А полностью совпадают, но 


* 
) Для ГО-разложения здесь поочередно используются формулы 


а ие | ыы а 
и, =а,- УИщик при 13], 1, = _ нь при 7>/]. 
= и &=1 
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во втором случае не так заметно стремление к нулю поддиагональных 
элементов, хотя, относительная скорость убывания модулей наддиаго- 
нальных элементов Ах и поддиагональных элементов А; примерно оди- 
накова. 


Одним из серьезных факторов, ограничивающих сферу при- 
менения 1. -алгоритмов, является их недостаточно хорошая чис- 
ленная устойчивость (улучшение этого параметра путем переста- 
новок строк и столбцов сильно отражается на экономичности ме- 
тода). Этот фактор может играть особенно существенную роль на 
фоне возможной неустойчивости самой несимметричной про- 
блемы собственных значений. 

Ярким примером матрицы, для которой задача нахождения 


собственных чисел является неустойчивой, служит ихи-матрица 
[138] 


о 

оо 
А= , 
000 о 1 


00000 


имеющая число 0 собственным значением и-й кратности. Введем 
возмущение & в левый нижний элемент матрицы А. Характери- 
стическим уравнением для возмущенной матрицы 


ого 
оо 0 


> 


©) 
(=>) 
> 
> 
> 


служит уравнение 
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Раскрывая определитель по элементам первого столбца, получаем : 


ди 0 0 гол оо 
Е т 00 

= Да О", =0 => 
о ой -4 1 ее 53 
о ол 0-4 о 0й -41 


© -4(-4" +" "Е=0 © Л-ЕЗО. 


Следовательно, матрица А, имеет и различных, в общем, ком- 
плексных собственных значений #1; =У=, 1=Ь2.й „и. Ве 
взять, например, и=100, а ==10-100, то [= 0.1, т.е. чрезвы- 
чайно малое, неощутимое для вычислительной машины искаже- 
ние всего одного элемента данной специфической матрицы при- 
водит к существенному изменению ее спектра. 

Разумеется, большинство важных в приложениях задач на 
собственные значения не так плохи. Однако, обозначив и, воз- 
можно, намеренно утрировав проблему, призовем читателя к ос- 
торожности в применениях уже рассмотренных методов и интер- 
претации их результатов, а также к пониманию необходимости 
построения более устойчивых методов численного решения не- 
симметричных спектральных алгебраических задач (см. следую- 
щий параграф). Численная устойчивость всех описываемых здесь 
методов подробно изучается в [179]. 


4.6. ОВ-АЛГОРИТМ 


В идейном плане от схематично описанного выше 
[)-алгоритма мало чем отличается так называемый 


ОК-алгоритм°) [3, 13, 42, 43, 75, 138, 141, 179]. При 
К=0, 1, 2, Й , начиная с Ау:=А, здесь строят последователь- 
ность матриц (А; ) по формулам 


Ар =О: Ву, Арн= Ву, (4.36) 


® 
) Этот метод предложен почти одновременно российским матема- 
тиком Кублановской (1961 г.) и англичанином Фрэнсисом (1962 г.). 
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первая из которых означает разложение матрицы Ах в произве- 
дение ортогональной О; и правой треугольной В, (такое раз- 
ложение существует для любой квадратной матрицы [13]), а вто- 
рая — перемножение полученных в результате факторизации Ад 
матриц О; и В, вобратном порядке. 

Аналогично предыдущему (см. $ 4.5) на основе свойства ор- 
тогональных матриц 07 = о в соответствии с (4.36) можно за- 
писать представление данной матрицы А в виде 


А=О0Ой Ор ОАО Ой 9100 


или, иначе, 


А= (009 й ОО А (Ой 9)”. (4.37) 


Следовательно, любая из матриц последовательности (Ах) орто- 


гонально подобна матрице А. 

При определенных ограничениях, одним из которых опять 
выступает требование, чтобы матрица А не имела равных по мо- 
дулю собственных значений, генерируемая процессом (4.36) по- 
следовательность матриц (А;) сходится к матрице правой тре- 
угольной формы с диагональю из собственных чисел. Скорость 
обнуления поддиагональных частей матриц А; линейна и зави- 
сит, как и во многих ранее рассмотренных методах, от отноше- 
ний МИА при #> / (по-прежнему считаем |1 |>|2|>й >)„|). 
Наличие комплексно сопряженных пар собственных чисел у дан- 
ной вещественной матрицы А не является, вообще говоря, пре- 
пятствием для применения ОК-алгоритма; просто в этом случае 
предельной матрицей для последовательности (Ау) будет мат- 
рица квазитреугольного (иначе, блочно-треугольного) вида. Ка- 
ждой комплексной паре собственных чисел в такой матрице бу- 
дет соответствовать диагональный 2х2-блок, причем сходи- 
мость здесь наблюдается по форме матрицы, а не поэлементно 
(т.е. элементы внутри этих блоков могут изменяться без видимой 
зависимости от К при сохранении неизменными их собственных 
чисел). 
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Обычно ОК-алгоритм (4.36) применяют не к исходной матри- 
це А, ак подобной ей правой почти треугольной матриие В, 


называемой также матрицей Хессенберга’), вида 
Ри 52 =. Миа Вы 
Бот 22 -. Бэпа Бэн 

_ 0 6:2 -.. бала В 
0 б г бана Вал 
0 Юг: Ь 


п,п—1 пи 


В основе преобразования А к виду В (определяемому ус- 
ловием Ь; =0 при /<:-1) лежит преобразование Хаусхолдера 
или, иначе, преобразование отражения, осуществляемое с по- 
мощью матрицы отражения (Хаусхолдера) 

Н=Е-2\/\", 


где У\У\ — произвольный вектор-столбец, но такой, что его евк- 
лидова норма равна единице. В силу этого требования к вектору 
У, выполняется равенство 


МБ =(\, М) = МГУ =1, 


и с учетом симметричности матрицы Н, вытекающей из симмет- 
ричности матрицы 


ий И? ТИ В ИИ, 
Й/. 2 

мт = |? ;т,)=| ИА ИЗ ИИ» |, 
И’, И’ И й И 


имеем: 


ННГ =Н? =Е-4\М Г +4 ГУМ Г ЕЕ. 


* м 

) Карл Хессенберг (1904—1959) — немецкий инженер. Иногда поч- 
ти треугольной формой матрицы называют упомянутые матрицы блочно- 
треугольного вида [138]. 
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Следовательно, матрица отражения ортогональна, и ‚значит, мат- 
рицы Аи В, связанные соотношением являются подобными 


В-НАН (=НАН” =НАН`\), 


Теперь нетрудно сообразить, как нужно распорядиться сво- 
бодой задания элементов векторов У при построении матриц 
отражения, чтобы за конечное число шагов преобразований Ха- 
усхолдера произвольно заданную матрицу А привести к форме 
Хессенберга В. 

А именно, можно показать, что начатым с В| = А процессом 


Вов Н»;, =. „п-8, (4.38) 
где Н„=Е-2\,\, данная ихи-матрица А за и-2 шага бу- 


дет приведена к виду В, т.е. матрица В:=В„_| подобна А, если 
задающие матрицы Хаусхолдера Н» векторы У/„ по данной 
** 


матрице А строить следующим образом 
При т =1 вектор У! определяется равенством 


\ = д (0; а - чз азуй зат), (4.39) 


и 1 


2 
УД, к 
о. 251 ($1 — а21) 


У! обеспечивает ортогональность симметричной матрицы 


где 51 = $1еп(- 421): . Такое задание 


Н!=Е-2У МГ 


и одновременное получение с ее помощью нужных и-2 нулей в 
первом столбце матрицы 


В. =НВН, (=НАН)). 


Вектор У\› по матрице В› строится совершенно аналогич- 
но, только фиксируются нулевыми не одна, а две первые его ко- 
ординаты, и определяющую роль играют теперь не первый, а 
второй столбец матрицы В) и его третий элемент. При этом у 
матрицы В; =Н›В›Н» окажется и-—3 нулевых элемента во вто- 
ром столбце и сохранятся полученные на предыдущем шаге нули 
в первом столбце. 


*) Матрица отражения обладает рядом других интересных свойств; в 
частности, ее название связано с тем, что линейное преобразование, осу- 
ществляемое такой матрицей, оставляет без изменений векторы, ортого- 
нальные вектору У\, а коллинеарные ему векторы переводит в противо- 
положные («отражает»). 


Жж 
) Логику таких построений, основанную на сохранении евклидо- 
вой нормы столбца, см., например, в [179]. 
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Этот процесс очевидным образом может быть продолжен до 
исчерпания и без особого труда может быть описан общими 
формулами типа формул (4.39), для чего нужно лишь ввести обо- 
значения для элементов последовательности матриц В» (напри- 
мер, с помощью верхних индексов 17). 

Рассмотрим на простом числовом примере, как приводится 
матрица к форме Хессенберга, когда для этого требуется только 
один шаг преобразований Хаусхолдера. 


1-3 
Пример 4.5. Дана матрица А=| 3 0-2]. Найти матрицу В, по- 
-4—1 1 


добную матрице А и имеющую форму Хессенберга. 
Решение проводим по формулам (4.38), (4.39) при п=3, которые 
для данного случая можно записать так (в естественном для выполнения 


порядке): 
Е | р) 2 1 
5=$1е1(-а21)- а1+аз1; "ЕР 
ми 


\Т = (0; а -5; а); Н=Е-2\М\Т; В-=НАН. 


ДЕД неба пе а 
° ыы ы \/2(-5)(-5-3) 45 


Имеем: 


0 ооо 
27 = 8 (0:8; —4)=|0 1.6 -0.8 |; 
—4 0-0.8 0.4 
оо = 
Н=|0 -—0.6 03|; НА=|-5-0.8 2]; 
0 08 056 00.6 —1 
5 2 = 
В=|-5 2.08 0.56 |. 
0 —0.44 —1.08 


Замечание 4.9. При решении симметричных проблем собст- 
венных значений методом вращений на первой стадии решения также час- 
то применяют преобразования Хаусхолдера. Абсолютно те же форму- 
лы (4.38), (4.39) приведут симметричную матрицу А к подобной ей мат- 
рице В трехдиагонального вида (частному случаю формы Хес- 
сенберга), что значительно повышает эффективность последующих пре- 
образований плоских вращений Якоби. 
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Замечание 4.10. Если начать процесс построения матриц отражения 
Ни не по формулам (4.39), а по аналогичным им, но с ключевым элемен- 
том а11, т.е. полагая 


т аа 
\ =А (а-я; 421; й ; аш), 


я =911(-@11): Фа? тт 
1421 и) 


то за и- 1 шаг ортогональных преобразований 
В 1=НиВи; т=12,й ‚п-1; В =А 

можно получить разложение матрицы А в произведение ортогональной 
Н:=Н,„_й Н>Н, и правой треугольной В :=В „, так как результирующее 
равенство В =НА равносильно равенству А=НТВ в силу ортогонально- 
сти Н. Приведение матрицы А такими преобразованиями к треугольному 
виду составляет основу метода отражений решения линейных алгеб- 
раических систем. Из равносильности равенств Ах=Ь, НАх=НЬ и 
Вх=НЬ легко понять, что для решения СЛАУ этим методом нужно над 


вектором свободных членов Ь выполнять те же преобразования, что и над 
матрицей коэффициентов А, после чего нужно будет сделать только об- 
ратный ход, как в методе Гаусса. Метод отражений решения СЛАУ в пол- 
тора раза экономичнее метода вращений ($ 2.7) и практически не уступает 
последнему по устойчивости к накоплению ошибок округлений. Более 
подробно об этом методе см., например, в [54]. 


Вообще говоря, весь ОВ-алгоритм (4.36) от начала и до кон- 
ца может быть построен на базе описанной выше процедуры 
преобразований Хаусхолдера, направленной сразу на триангуля- 
ризацию в соответствии с замечанием 4.10. Однако такой подход 
значительно сужает границы применимости алгоритма и ухудша- 
ет его скоростные качества. 

Обычно на втором этапе применяют другое ортогональное 
преобразование — преобразование плоских вращений Гивенса. 


п 
Определяющая эти преобразования матрица С’, ее т 1-1 при 
фиксированных 1, / — индексах ключевого элемента преобра- 


зуемой матрицы — имеет точно такую же структуру, как и мат- 
рица плоских вращений Якоби Т,; (ср.(4.27)), только здесь, сле- 


дуя [138], двумерную подматрицу из элементов, стоящих на пе- 
ресечении 1-хи /-х строк и столбцов, возьмем в виде 


^ С 
а 


Как и прежде, числа 5 и с связываем соотношением 52462 =1 
(это позволяет интерпретировать их как синус и косинус некоторо- 


го угла @), обеспечивающим ортонормированность матриц С, 
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Первый полный шаг преобразования Гивенса, применяемо- 
го к матрице Хессенберга В и-го порядка в рамках ОВ- 
алгоритма (4.36), состоит из и-1 элементарных подшагов, 
имеющих целью последовательное обнуление поддиагональных 
элементов в столбцах от первого до (и-1)-го. В результате этого 
получается разложение матрицы В в произведение ортогональ- 
ной и треугольной, что требуется первой формулой (4.36) при 
= 1, А: :=В. 

Чтобы определить 5 ис на, первом промежуточном шаге, 


рассмотрим произведение матриц 
5 с0.. 0ОУЫ, ВБ) В: .. В 
—с5$ 0... 0 | 521 622 6» ... Би 
СВ= 0 01..0| 0 Б.> 65533 ... 65, |= 


о00.. 10 0 0.ь, 
561 1+сЬ>1 512+сБо 5 з+сБоз в 5Ви+сЬой 
—с1+5Ь1 —с612+5622 —сЬ3+5ЬЬз зве — с и+5Ь2и 
ы 0 Ьз2 Бзз Би 
0 о 0 р 


: Ь 
Беря с=с0$0 и 5=зт8 такими, что ш9= будем иметь 


Ь 1 с0$6 =Ь1 тб, т.е. —с161+5Бо1 =0. Значит, результат первого 
промежуточного шага — матрица В\=С В, получающаяся при 
таких с и $, не будет содержать ненулевых элементов под диа- 
гональю в первом столбце. 

Второй промежуточный шаг совершается аналогично: мат- 
рица В›=СоВ| получается из предыдущей В1 с помощью мат- 
рицы Гивенса Со, отличающейся от С; тем, что подматрица 


5 с 
смещается на одну позицию вдоль диагонали и угол пово- 
—Сс5 


рота подбирается так, чтобы в матрице Во обнулить элемент ь@. 


* 
) Так как в каждом столбце матрицы Хессенберга нужно «убивать» 
только по одному элементу, то в данном случае матрицы элементарных 
вращений Гивенса можно помечать только одним индексом. 
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Продолжая этот процесс преобразований Гивенса далее, в 
итоге получим правую треугольную матрицу 


Ви =С,С„_2й С.С В. 
Последнее равенство можно переписать в виде 
=] те 
(С.С 2й С›С1) В,=В, 


который позволяет считать выполненным требуемое в (4.36) при 
К =1 разложение 


В= ОВ, 
где О! = (С.С, й 6>С,1)'=С7А СГ, — ортогональная, а 
В, :=В,_| — правая треугольная матрицы. При этом матрица 
А› = 101 = („ай СОВ(С,ай 61)", (4.40) 


являющаяся результатом первого полного шага ОВ-алгоритма 
(примененного к В), сохраняет не только спектр данной матри- 
цы, но и форму Хессенберга [43, 138], благодаря чему приведе- 
ние исходной матрицы А к почти треугольному виду В доста- 
точно сделать только один раз. 


Очевидно, скалярные параметры с ;=с0$0 ; и 5,=зш@, мат- 


риц Гивенса с, с помощью которых осуществляется переход от 


матрицы Хессенберга в-(ь, у ‚ “Транзитом» через матрицы 
„и 

Хессенберга в, (7) „1 К Матрице Хессенберга А›, можно 

вычислять на /-м промежуточном шаге (1=1,2,й ‚и-1) по 

формулам 


ву = ру МР 
1+1; 
где 
Ио т 
Ве. _ 
7 509 (- 9), = 
Н 
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(если знаменатель в выражении Г, равен нулю или по модулю 


меньше некоторого существенно малого порогового значения, то 
можно считать с ; =0, 5} =1, т.е. С,:=Е). 


Пример 4.6. Преобразованиями Гивенса выполним один шаг 
5 = ыы 
ОВ-алгоритма для матрицы В=|-5 2.08 0.56 |, полученной в резуль- 
0 —0.44 —1.08 
тате преобразований Хаусхолдера в предыдущем примере. 
При /=1 последовательно находим: 


Э 1 1 
==, а= =, 
= У1+(- 1)? 2 


— 0.5/2 0.5/2 0 
С=| -0.52 —0.52 0 |, 
0 о 1 


—5\2 2.5442 0.7842 
В =С1В= 0 0.462 0.2242 |. 
0 —-0.44 —1.08 


= 


При /=2 вычисляем (округляя до 10-5): 


2= 0462 | 4увдоб, со =0.560248, 5) =-0.828325; 
— 0.44 
значит, 
1 0 0 
С) =| 0 -—0.828325 0.560248 |, 
0 —0.560248 —0.828325 
—7.071068 3.592102 14103087 
В =В, =С.В| = 0 — 0.785366 —0.862782 |. 
0 0 0.720283 
Следовательно, 


0.707107 0.585714 0.396155 
0 =С!С)=| 0.707107 0.585714 0.396155 
0 0.560248 —0.828325 


, 
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и, согласно (4.40), матрица 
7.540002 -1.419666 -2.291860 


А› =В О; =| -0.555338 -—0.943372 0.403537 


0 0.403537 -0.596628 


есть искомый результат первого полного шага ОК-алгоритма. Она имеет 
те же собственные числа, что В и А, сохраняет форму Хессенберга и мо- 
дули ее поддиагональных элементов меньше, чем у матрицы В, т.е. она 
более близка к подобной В матрице треугольного вида, на диагонали ко- 
торой должны быть собственные числа данной матрицы (1, = 7.639, 


12 =-1.205, Аз =-0.435). 


Замечание 4.11. Весь ОК-алгоритм можно было бы построить на 
базе одних только преобразований Гивенса, т.е. не приводя исходную 
матрицу А к форме Хессенберга (или к трехдиагональному виду, если А 
симметрична) другими преобразованиями. В таком случае стала бы за- 
метной разница между преобразованиями Якоби и Гивенса. Суть этой 
разницы в следующем: если для преобразований Якоби понятия «ключе- 
вой элемент» и «обреченный элемент» совпадают, то для преобразований 
Гивенса это, вообще говоря, не так. В общем случае при вращениях Ги- 
венса угол поворота @ в фиксированной индексами Г, / плоскости враще- 
ния подбирается так, чтобы аннулировать какой-нибудь элемент, стоящий 
либо в одном столбце, либо в одной строке с ключевым элементом ау. 
Такие преобразования теряют свойство минимальности суммы квадратов 
внедиагональных элементов, имевшее место в преобразованиях оби для 
симметричных матриц, но позволяют (Гивенс, 1954г. [179]) привести 
симметричную матрицу к трехдиагональному виду существенно быстрее, 
чем это требуется для выполнения одного цикла преобразований в методе 


* 
вращений Якоби ). Приведение несимметричных матриц к форме Хессен- 
берга методом Гивенса требует большего числа арифметических опе- 
раций, чем это нужно для такого приведения методом Хаусхолдера, по- 
этому обычно для этих целей отдают предпочтение последнему. 


Приведенных выше сведений, в принципе, вполне доста- 
точно, чтобы находить ОК-алгоритмом все хорошо отделимые 
вещественные собственные числа вещественных матриц, реали- 
зуя равенство (4.37) при некотором К ‚ хотя здесь и нет должного 

** 


для этого обоснования ’. Однако в такой непосредственной 
форме ОК-алгоритм не применяется ввиду его медленной сходи- 
мости. Для ускорения сходимости в процесс (4.36) вводят сдвиги, 


* 

) Для вычисления собственных значений трехдиагональных 
матриц разработан не рассматриваемый здесь довольно эффективный 
метод бисекций [29, 42, 179], который также можно считать одним из 
способов локализации собственных чисел. 


#* 

) Доказательство сходимости ОК-алгоритма и его модификаций 
см. в [75, 179]. В [141] изучается сходимость принятого там за основу 
ОТГ-алгоритма. 
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о роли которых немало говорилось при изучении метода обрат- 
ных итераций (см. $ 4.3). При выборе параметров сдвигов в ОК- 
алгоритме учитывается подмеченная ранее целесообразность ис- 
пользования для этого приближений к собственным числам. В 
данном случае принимается во внимание, что формируемая ОК- 
алгоритмом последовательность матриц Ах в пределе дает пра- 
вую треугольную матрицу с диагональю из собственных чисел 
(когда все собственные числа матрицы А вещественны). Следо- 
вательно, есть основания утверждать, что последовательность эле- 
ментов а®) может рассматриваться при К=1,2,й как последо- 
вательность приближений к какому-то определенному собствен- 
ному числу матрицы А и служить соответствующей последова- 
тельностью параметров переменных сдвигов, ускоряющих про- 
цесс обнуления поддиагональных элементов. 

Таким образом, по крайней мере, в случае, когда данная 
матрица А имеет только вещественные собственные значения, 
ОК-алгоритм будет сходиться более быстро (квадратично), если 
при каждом А преобразования Гивенса применять не к матрице 
А, ак матрице А; =А, -а®Е. При этом каждый раз спектр 
матрицы смещается на величину произведенного сдвига (см. 
свойство 4.2 в $ 4.1), что может учитываться двояко: либо пара- 
метры сдвигов суммируются и затем сумма прибавляется к най- 
денным в итоге значениям, либо каждый раз делается обратный 
сдвиг, т.е. вместо формул (4.36) используются формулы: 


А-а Е= О 


(ОК-факторизация матрицы Ау — а(* Е ), 


Г 
Аз = В, Ог+аЕ 
(перемножение в обратном порядке и обратный сдвиг). 


Важно учесть, что большая экономия вычислительных за- 
трат при реализации ОК-алгоритма получается в результате 
включения сюда процедуры исчерпывания. Нетрудно показать, 
что если на каком-то шаге К = Ко последняя строка матрицы и-го 


порядка А), стала нулевой (с некоторой точностью), то это по- 


(к) 


зволяет считать Ари собственным числом, а другие ее собствен- 


ные значения находить, работая далее только с подматрицей 
(п-1)-го порядка, получающейся из А № отбрасыванием послед- 


них строки и столбца. 
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Если у данной матрицы возможны комплексные собствен- 
ные значения, применяют более сложный процесс двойных сдви- 
гов [75, 138, 179], позволяющий преодолеть ситуацию, когда в 
конце диагоналей матриц Ау; «прорисовывается» 2х2-блок, со- 
ответствующий паре комплексно сопряженных собственных 
чисел. 

Нахождение собственных векторов в рамках ОК-алгоритма 
(и других методов, основанных на асимптотической триангуля- 
ризации) не является такой простой задачей, как это было в ме- 
тоде вращений Якоби для симметричных матриц, диагонализи- 
руемых в процессе ортогональных преобразований. Однако при 
известном собственном числе соответствующий ему собствен- 
ный вектор эффективно может быть найден рассмотренным в 
$ 4.3 методом обратных итераций (см. формулы (4.19),(4.20)). 
При этом обратные итерации обычно применяются не к исходной 
матрице А, ак матрице В, подобной А и имеющей форму Хес- 
сенберга. Если приведение А к виду В выполнялось преобразо- 
ваниями Хаусхолдера (4.38), то В = НГАН, где Н — результи- 
рующая матрица и-2 элементарных отражений, и значит, со- 
гласно свойству 4.7 ($ 4.4), найдя собственный вектор у матрицы 
В, искомый собственный вектор х данной матрицы А получаем 
равенством х=Ну. 


УПРАЖНЕНИЯ 
30—12, 553 
4.1. Дана матрица А=|-42 19-78 |. 
—28: 12—51 


А) Степенным методом найдите несколько последовательных при- 
ближений к доминирующему собственному числу матрицы А и к соот- 
ветствующему собственному вектору. Зная, что искомое собственное чис- 


ло есть 7! =-5, проверьте, насколько эффективно здесь применение д”. 
процесса Эйткена (см. замечание 4.6). 

Б) Методом обратных итераций найдите младшую собственную па- 
ру {Яз, хз} данной матрицы А. Можно ли утверждать, что Яз =Л+41, 
где Л — наибольшее по модулю собственное число матрицы А-11Е? 


4.2. В условиях примера 4.1 начните ЗР-алгоритм ($ 4.2) с вектора 


Т 
у(©) = (1; 1)’. Что получено после выполнения одного полного цикла ал- 
горитма? Дайте объяснение результату. 
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4.3. Найдя грубые приближения к собственным числам матрицы 


$5 = 
А=|4 5 -4 
64 —4 


степенным методом, уточните эти значения обратными итерациями со 
сдвигами (см. (4.24)). 


4.4. А) Проанализируйте сходимость степенного метода в случае, 
когда 11 — кратное вещественное наибольшее по модулю собственное 
число и-мерной матрицы простой структуры (см. формулы (4.10), (4.11)). 
Как можно найти все соответствующие ему собственные векторы в зави- 
симости от показателя кратности? 


Б) Что можно сказать о поведении последовательности отношений 
(4.10), если д =-12 и |2|>|№3|[> й >| (Ее)? 

В) Рассмотрите и объясните поведение степенного метода в случае, 
когда данная матрица А — диагональная. 


4.5. Найдите все собственные пары матрицы 


42-1 
А= 24 1 
а: 


а) методом скалярных произведений (для нахождения второй собст- 
венной пары используйте формулы (4.14), (4.15)); 


6) КО]-алгоритмом, начиная его с различных векторов. 


4.6. Методом вращений Якоби найдите собственные пары матрицы 
А, если: 


в 6 —2 
а) | } 6) А=-2 5 © 
-1 2 
2 0 


4.7. Сравните два подхода к нахождению всех собственных чисел 
матрицы 


211 
А=|Т 2 1 
112 
методом вращений Якоби: 

А) применяя его непосредственно к данной матрице; 


Б) предварительно приведя ее к трехдиагональному виду преобразо- 
ваниями Хаусхолдера. 
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4.8. Для нахождения собственных пар симметричных положительно 


определенных матриц постройте ГО-алгоритм на базе ото (или Е. №. 
разложения Холецкого (см. гл. 2). Опробуйте его на матрицах 


610 
5—2 
А= и В=1 5-2 
— 2 
0.—2 1 


Сохраняют ли получаемые на каждом шаге такого алгоритма по- 
добные В матрицы трехдиагональную структуру? 


4.9. Дана матрица А - 5 Сделайте по три шага: 


а) ГО-алгоритма; 

6) ОК-алгоритма на основе преобразований Гивенса; 

в) ОК-алгоритма на основе преобразований Хаусхолдера (с учетом 
замечания 4.10). 

Сравните полученные приближения к собственным числам матрицы 
А по точности (найдя сначала ее точные значения с помощью характери- 
стического уравнения) и по вычислительным затратам. 


4.10. Матрицу А из упр. 4.7 приведите к трехдиагональному виду 
преобразованием Гивенса (отличным от преобразования Якоби, см. заме- 
чание 4.11). 


4.11. Для ихи-матрицы сделайте приблизительный подсчет количе- 
ства арифметических операций, приходящихся на: 

а) один шаг степенного метода; 

6) один шаг метода обратных итераций (без сдвигов); 

в) один полный цикл метода вращений Якоби; 

г) полный цикл приведения матрицы к форме Хессенберга преобра- 
зованиями Хаусхолдера. 


4.12. Методом отражений решите систему 
х -2у + 2=0, 
2х —- у - 22=6, 
2х - у- 2= 
(см. замечание 4.10). 


4.13. Выведите формулы для преобразования их и-матрицы Хессен- 
берга к треугольной форме плоскими поворотами на углы ф, 


(1=Ь2,й ‚ п-1) с помощью матриц т, =Т, 7+1 Вида (4.27). Как отлича- 
ются углы ф; от углов 9 ‚› неявно присутствующих в представлении 
(4.40)? 
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ГЛАВА $| МЕТОДЫ РЕШЕНИЯ НЕЛИНЕЙНЫХ 
СКАЛЯРНЫХ УРАВНЕНИИ 


Рассматриваются различные аспекты решения одномер- 
ных нелинейных уравнений. В частности, обсуждается задача 
локализации корней и простейшие способы сужения промежут- 
ков их существования, даются определения основных типов 
сходимости итерационных последовательностей и связанных с 
ними порядков итерационных методов. Наряду с методами, об- 
ладающими линейной сходимостью, такими, как метод дихо- 
томии и метод хорд, изучаются методы более высоких поряд- 
ков. Наибольшее внимание здесь уделяется методу касательных 
Ньютона и методу секущих, рассматриваемому в качестве 0д- 
ной из модификаций метода Ньютона, превосходящей его по 
эффективности в смысле вычислительных затрат. Последний 
параграф главы посвящен новым методам, так называемым по- 
люсным методам Ньютона и секущих, которые при надлежа- 
щем фиксировании параметров расширяют области примене- 
ния классических методов Ньютона и секущих и в равных с ними 
условиях выигрывают у них в быстроте сходимости (без допол- 
нительных вычислений значений функции). 


5.1. ЛОКАЛИЗАЦИЯ КОРНЕЙ 


Будем рассматривать задачу приближенного нахождения 
нулей функции одной переменной, иначе, задачу нахождения 
корней уравнения вида 


7х) =0, (5.1) 


где /: К, > В, — алгебраическая или трансцендентная функ- 


ция. Такие уравнения называют скалярными, числовыми, ко- 
нечными и т.п. Методам их решения посвящена обширная лите- 
ратура; кроме перечисленных здесь учебных и научных изданий, 
эту тему можно встретить почти в любом учебнике математиче- 
ского анализа или высшей математики, а во многих учебных по- 
собиях по программированию даются «рецепты» решения таких 
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задач”). Однако не все авторы учебников по вычислительной 
математике считают нужным включать рассматриваемую тему 
самостоятельным разделом. И в этом есть резон. Действительно, 
многие наиболее фундаментальные методы решения скалярных 
уравнений можно рассматривать как частные случаи соответст- 
вующих методов решения систем нелинейных уравнений со мно- 
гими неизвестными и даже, более того, нелинейных оператор- 
ных уравнений (как правило, в банаховых пространствах). Такой 
путь изучения методов более короток, но и более труден. Учиты- 
вая, что одномерный случай более прост и легко интерпретиру- 
ется геометрически (что немаловажно для нелинейных задач), а 
также то, что обычно теоретические результаты, полученные для 
скалярных уравнений, затем переносятся (не без потерь) на сис- 
темы и операторные уравнения, изучаемые методы будут гораздо 
лучше поняты, если в них сначала как следует разобраться на 
объектах вида (5.1). 

В общем случае, если речь идет не об отдельных достаточ- 
но узких классах уравнений, например, изучавшихся в школьном 
курсе математики, можно говорить лишь о приближенном 
вычислении корней уравнений (5.1), т.е. таких значений аргу- 
мента х=&, при которых равенство 


2) =0 
истинно. При этом под близостью приближенного значения Хх к 
корню & уравнения (5.1), как правило, понимают выполнение 
неравенства 

Е-Х<= 
при малых &>0, хотя часто бывает важным контролировать не 
абсолютную погрешность приближенного равенства х = &, а от- 
носительную, т.е. величину | —Х|/Х|, например, когда величина 
[х| близка к нулю. 


Нелинейная функция Х(х) в своей области определения 
р(У)< ЕВ, может иметь конечное или бесконечное количество 


нулей или не иметь их вовсе. Большинство же методов нахожде- 


= 

) Можно понять преподавателей, обучающих алгоритмическим 
языкам: методы решения скалярных уравнений предоставляют для этого 
благодатный материал. К сожалению, программирование формул без 
понимания их сути часто лишь компрометирует вычислительную 
математику. 
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ния нулей требует знания промежутков (возможно, малых), где 


заведомо имеется и притом единственный нуль функции”). Если 
такие конкретные промежутки не предоставляются постановщи- 
ком задачи, то на первый план выходят: выявление ситуации с 
наличием и количеством корней уравнения (5.1), нахождение об- 
ласти их расположения, получение отрезков, на которых имеется 
точно по одному корню. Иными словами, ставятся подзадачи 
существования и единственности, нахождения грании и ло- 
кализации корней. Эти подзадачи обычно решаются в комплексе 
средствами математического анализа. Но и численные методы 
здесь часто выступают в помощь математическому анализу: как 
будет видно из дальнейшего, многие теоремы сходимости итера- 
ционных методов можно считать локальными теоремами суще- 
ствования и единственности. 

Для функций общего вида нет универсальных способов ре- 
шения поставленных подзадач. Так что здесь, как говорится, все 
средства хороши. 

Если функция Г(х) такова, что без особого труда можно 
построить ее график, этим следует воспользоваться, чтобы пред- 
ставить ситуацию с количеством и расположением нулей /(х), 
выделяя те промежутки оси абсцисс, где график у= Г(х) пересе- 
кает Ох. (Знание графика много дает и для понимания поведения 
тех или иных процессов вычисления приближений к корням.) 
Может оказаться, что построение графика у= /(х) вызывает за- 


труднения, но исходное уравнение (5.1) очевидным образом 
представляется в виде 


Л@)= (>) 
и функции Л (х) и Л>(х) таковы, что легко строятся графики 
у= Л (х) и у= № (х). Тогда задача определения количества кор- 
ней и областей их единственности решается отслеживанием то- 
чек пересечения этих графиков и выделением на оси абсцисс тех 
промежутков, которым принадлежат проекции таких точек. Опи- 
санный прием называют графическим способом локализации 
(иначе, отделения, изоляции) корней. 


Пример 5.1. Найдем промежутки изоляции корней уравнения 


х2? -зтх-1=0. 


* 
) Перефразируя Конфуция, можно сказать: трудно найти корень на 
бесконечном промежутке, особенно, когда его там нет. 
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Представив это уравнение в виде х2 -1=зх, строим схематично 
графики функций у=х2 —Ти у=зшх (рис. 5.1). 


А 5 


—1 


Рис. 5.1. Графическая локализация корней уравнения х2 -зтх-1=0 


Совместное рассмотрение графиков позволяет сделать заключение, что 
данное уравнение имеет два корня: | =[-1, 0] и &› Е[|, 7]. 


Убедиться в том, что на данном отрезке [а, 6] (например, грубо оп- 
ределенном графическим способом) действительно имеется нуль непре- 
рывной функции /(х), можно аналитическим способом, в основе кото- 
рого лежит известное утверждение математического анализа. 


Теорема 5.1 (Больцано-Коши). Если непрерывная на 
отрезке [а, В] функция Г(х) на концах его имеет противо- 
положные знаки, т.е. 


Л(а)7(Ъ)<0, (5.2) 


то на интервале (а, Ь) она хотя бы один раз обращается в 
) 


* 
нуль °. 


Очевидна слабость теоремы 5.1 при ее применении к по- 
ставленной задаче: она не дает ответа на вопрос о количестве 
корней на отрезке [а, 6] в случае выполнения условия (5.2) (их 
может быть нечетное число) и не позволяет утверждать, что на 
отрезке [а, Ь] нет корней, когда условие (5.2) не выполнено, так 
как в этом случае их может оказаться на [а, Ь] четное количество 
(нетрудно представить себе соответствующие «картинки» 


возможных поведений графиков функций на отрезке). 


* 
) Допустимо считать, что а и/или В могут принимать значения 
—00 и/или +0 соответственно. В таком случае (а) и/или Х(Ь) следует 


понимать в предельном смысле, также допуская возможность бесконеч- 
ных предельных значений / определенного знака. 
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Результат, сформулированный в виде теоремы 5.1, можно 
значительно усилить, если требование непрерывности функции 
1 (<) на [а, Ь] дополнить требованием монотонности ее на этом 
отрезке. 


Теорема 5.2. Непрерывная строго монотонная функ- 
ция Г(х) имеет и притом единственный нуль на отрезке 
[а, 6] тогда и только тогда, когда на его концах она при- 
нимает значения разных знаков. 


Последняя теорема позволяет не только принимать, но и от- 
вергать те или иные промежутки из области определения О(/) 
данной функции на предмет дальнейшего поиска ее нулей, если 
известно о ее монотонном поведении на этих промежутках и оп- 
ределены знаки значений функции на их концах. 

Реально установить монотонность на данном отрезке можно 
для дифференцируемой функции, потребовав знакопостоянст- 
во ее производной на всем отрезке. Для таких функций основой 
решения задачи локализации корней уравнения (5.1) может слу- 
жить следующая теорема. 


Теорема 5.3. Пусть Ге СЦа, Ь]. Тогда, если Х’(х) не 
меняет знак на (а, Ь), то условие (5.2) является необходи- 
мым и достаточным для того, чтобы уравнение (5.1) име- 
ло и притом единственный корень на [а, В]. 


Так как производная может менять знак только в точках, 
где она равна нулю или не существует, а также в граничных точ- 
ках области определения функции, то в случаях (к сожалению, 
редких), когда уравнение /’(х)=0 легко решается, вопрос о ко- 
личестве и расположении корней уравнения (5.1) не вызывает 
трудностей. 


Пример 5.2. Выясним, сколько корней у уравнения х?е* =л игде 
они расположены. 


Обозначим У (С:=х2ех —л. Тогда /’(х)=х(х+2)е“. Очевидно, 
7'(х)=0 только при х=0 и х=-2. Поскольку /(х) и /'(х) определены и 
непрерывны на всей числовой оси, точки —2 и 0 — единственные на Ох 
такие, в которых может происходить смена убывания функции у= Х(х) на 
возрастание или наоборот. Поэтому, найдя знаки значений (в том числе, 
бесконечных) Шт /(х), Г(-2), /(0) и Ит Г(х), т.е. заполнив таблицу 

х>—® х—>-+с 


Г: | 


— 
знаков 
+ © 
а“ ) 
+ 
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можно на основании теоремы о. 3. утверждать, что данное уравнение имеет 
единственный корень, и этот корень положителен. Выяснив еще знаки 
1 (>) в точках х=1 (минус) и х=2 (плюс), область поиска корня данного 
уравнения с бесконечного промежутка [0, +) сужаем до промежутка 
единичной длины [1,2]. 

В ситуациях, далеких от рассмотренной идеальной, часто 
поступают следующим образом. Всю область определения (если 
она конечна) или какую-нибудь ее часть, вызывающую по тем 
или иным соображениям интерес, разбивают на отрезки точками 
х;, расположенными на условно небольшом расстоянии Й одна 
от другой (сюда включаются также граничные точки области оп- 
ределения). Вычислив значения /(х) во всех этих точках (или 
только определив знаки Г(х;)), сравнивают их в соседних точ- 
ках, т.е. проверяют, не выполнится ли на отрезке [х; 1, х;| усло- 
вие /(х;1)/(х;)< 0. Если заранее известно количество корней в 
исследуемой области, то, измельчая шаг поиска й, таким про- 
цессом можно либо все их локализовать, либо довести процесс 
до состояния, позволяющего утверждать, что возможно наличие 
пар корней, не различимых с точностью й = &. Этот хорошо при- 
способленный для вычислительных машин способ перебора яв- 
ляется дорогим в смысле затрат на получение многочисленных 
пробных значений функции и не дает гарантий выявления коли- 
чества и локализации всех корней в общем случае, что ограничи- 
вает сферу его применения. 

Одна из проблем, в которую упирается решение задачи ло- 
кализации корней, — это практическая невозможность точного 
вычисления значений функций. Она уже обсуждалась в главе 1. 
Вернемся к ней еще раз. 

Из-за ограниченности разрядной сетки компьютера даже 
алгебраические функции вычисляются приближенно, вычисле- 
ние же трансцендентных функций составляет тему отдельного 
разговора; ясно, что их значения за редкими исключениями по 
определению могут записываться лишь приближенно. Погреш- 
ности, с которыми вычисляются значения функции, порождают 
блуждания (иначе, флуктуации, случайные отклонения) ординат 
графика около средних значений. Если рассматривать небольшой 
участок графика какой-либо функции, построенной путем изо- 
бражения всех ее точек, вычисленных на компьютере при дис- 
кретном изменении аргумента с очень мелким шагом Й, с после- 
дующим соединением этих точек отрезками прямых, то окажет- 
ся, что этот реальный график имеет пилообразную форму 


(рис. 5.2). 
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0.99987 0.99993 1.00000 1.00006 1.00013 1.00019 


Рис. 5.2. Участок графика функции у= х3 —3х2+3х-1 ‚ полученный 
на компьютере ОХ5-133 вычислением ее значений с точностью о(о-? 6 
шагом ОО 


Эти вычислительные погрешности ограничивают точность, 
с которой можно находить корень. В результате их влияния та 
или иная процедура сужения промежутка локализации корня ра- 
но или поздно приведет к такому промежутку, называемому 
промежутком (отрезком, интервалом) неопределенности 
корня, что любое число из этого промежутка с одинаковым ус- 
пехом может быть принято за корень уравнения (сравните с про- 
межутком (& —б.п.&, & +6.п.&), который фигурировал в $ 1.6 
при рассмотрении затронутой проблемы в несколько иной поста- 
новке). 

Наличие флуктуаций значений функций, порождающих не- 
возможность точного вычисления корней нелинейных уравне- 
ний, следует всегда иметь ввиду, применяя те или иные числен- 
ные методы. Если не с самого начала итерационного процесса, то 
с приближением момента, когда погрешность метода становится 
сравнимой с погрешностью вычисления значений функций или 
выражений, входящих в расчетные формулы метода, целесооб- 
разно подключение приема Гарвика, упоминавшегося ранее 
(см. замечание 4.4). 
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5.2. МЕТОД ДИХОТОМИИ. МЕТОД ХОРД 


Пусть функция /(х) определена и непрерывна при всех 
хе [а, В] и на [а, 6] меняет знак, т.е. /(а)/(Ь)<0. Тогда согласно 
теореме 5.1 уравнение (5.1) имеет на (а, Ь) хотя бы один корень. 
Возьмем произвольную точку се (а, 5). Будем называть в этом 
случае отрезок [а,Б] промежутком существования корня, а 
точку с — пробной точкой. Поскольку речь здесь идет лишь о 
вещественнозначных функциях вещественной переменной, то 
вычисление значения Г(с) приведет к какой-либо одной из сле- 
дующих взаимоисключающих ситуаций: 


а) /(а)1(с)=0; 6) /(с)/()<0; в) Л(с)=0. 
Применительно к рассматриваемой задаче их можно интерпре- 
* 


тировать так 

а) корень находится на интервале (а, с); 

6) корень находится на интервале (с, Б); 

в) точка с является искомым корнем. 
Таким образом, одно вычисление значения функции позволяет 
уменьшить промежуток [а,Б] существования корня (ситуация а) 
или 6)) или указать его значение (ситуация в), маловероятная в 
смысле «прямого попадания» пробной точкой с в корень, но 
вполне реальная в смысле выполнения приближенного равенства 
Г(с) =0, когда длина промежутка существования корня близка к 
длине промежутка его неопределенности). Ясно, что в зависимо- 
сти от того, имеет место ситуация а) или 6), описанная процеду- 
ра одного шага сужения промежутка существования нуля непре- 
рывной функции /(х) может быть применена к промежутку 
[а,с]<[а, 6] или к [с,6]<[а,6] соответственно и далее повто- 
ряться циклически. Такой простой и легко программируемый 
процесс называется методом дихотомии (от греческого слова, 
означающего деление на две части), методом бисекиии, мето- 
дом вилки, методом проб. Если способ задания пробных точек 
с определен так, что последовательность длин получающихся в 
этом процессе промежутков существования корня стремится к 
нулю, то методом дихотомии можно найти какой-либо корень 
уравнения (5.1) с наперед заданной точностью. 


Наиболее употребительным частным случаем метода дихо- 
томии является метод половинного деления, реализующий са- 
мый простой способ выбора пробной точки — деление проме- 


* 
) Из-за допустимости неединственности корня в этой интерпрета- 
ции уже нет взаимоисключаемости ситуаций. 
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жутка существования корня пополам. Выполнить приближенное 
вычисление с точностью = корня уравнения (5.1) методом поло- 
винного деления при условии, что /(х) непрерывна на [а,Б] и 


(а) Г (6)<0, можно, например, по следующей схеме: 


Шаг 0. Задать концы отрезка а и Б, функцию Х, малое чис- 
ло =>0 (допустимую абсолютную погрешность кор- 
ня или полудлину его промежутка неопределенно- 
сти), малое число б>0 (допуск, связанный с реаль- 
ной точностью вычисления значений данной функ- 
ции); вычислить (или ввести) Х(а). 

Шаг 1. Вычислить с := 0.5(а+Ъ). 

Шаг 2. Если р-а<2=, положить &:=с (& — корень) и ос- 
тановиться. 

Шаг 3. Вычислить /(с). 

Шаг 4. Если |/ (с) < 6 , положить & := с и остановиться. 

Шаг 5. Если Х(а)/(с)<0, положить Б:=с и вернуться к 
шагу 1; иначе положить а:=с, Г(а):= (с) и вер- 
нуться к шагу 1. 


Замечание 5.1. В упрощенных вариантах схем реализации метода 
половинного деления обходятся без введения допуска д. В таком случае в 
шаге 4 вместо неравенства |/(с)]<6 используют равенство /(с)=0. То- 
гда разветвление алгоритма, диктуемое шагами 4 и 5, можно производить 
сравнением с нулем (с тремя исходами) произведения /(а)/(с). 


За один шаг метода половинного деления промежуток су- 
ществования корня сокращается ровно вдвое. Поэтому, если за 
К-е приближение этим методом к корню & уравнения (5.1) при- 
мем точку х;, являющуюся серединой полученного на А-м шаге 
отрезка [ах , 6» | в результате последовательного сужения данно- 
го отрезка [а, В], полагая а/ = а, В :=Ь, то придем к неравенству 


Е-ж|<—@ УкЕМ (5.3) 
2 


(априори, & — любая точка интервала (ах, В»), и расстояние от 
нее до середины этого интервала не превосходит половины его 
длины. Это как раз и видим в (5.3) при К =1). 

Неравенство (5.3), с одной стороны, позволяет утверждать, 
что последовательность (хх) имеет предел — искомый корень & 
уравнения (5.1); с другой стороны, являясь априорной оценкой 
абсолютной погрешности приближенного равенства хх =&, дает 
возможность подсчитать число шагов (итераций) метода поло- 
винного деления, достаточное для получения корня & с заданной 
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точностью &, для чего нужно лишь найти наименьшее натураль- 
ное К, удовлетворяющее неравенству 


Ь-а 
2 
Используемый в методе половинного деления способ фик- 
сирования пробной точки можно охарактеризовать как пассив- 
ный, ибо он осуществляется по заранее жестко заданному плану 
и никак не учитывает вычисляемые на каждом шаге значения 
функции. Логично предположить, что в семействе методов дихо- 
томии можно достичь несколько лучших результатов, если отре- 
зок [а,Б] делить точкой с на части не пополам, а пропорцио- 
нально величинам ординат /(а) и /(Б) графика данной функции 
1). Это означает, что точку с есть смысл находить как абсцис- 
су точки пересечения оси Ох с прямой, проходящей через точки 
А(а; Г(а)) и В(Ь; Х(Ь)), иначе, с хордой АВ дуги АЁВ (рис. 5.3). 
Запишем уравнение прямой, проходящей через две данные 
точки Аи В: 


<5. 


У-Л(а) _х-а 
/(Ь)- Г(а) Ь-а’ 


Отсюда, полагая у=0 (уравнение оси Ох), х=с (обозначение 
искомой точки пересечения прямой АВ с осью Ох), находим 


_„_ Ха-а) 
__ Л-Да) ти 


В(Ь; Х(Ь)) 


А(а; Г(а)) 


Рис. 5.3. Дуга графика функции Г(х) и стягивающая ее хорда 


Метод, получающийся в развитие метода дихотомии таким 
фиксированием пробной точки, называют методом хоро, 
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методом пропорциональных частей, методом линейной ин- 
терполяции. Все названия метода вполне естественны и отра- 
жают различные подходы к его выводу или интерпретации. Ино- 
гда (в последнее время реже) используют еще и название прави- 
ло ложного положения или гееша $1 [3, 72, 140]. 

Существует несколько версий реализации метода хорд. Од- 
на из них — подсчет значений с по формуле (5.4) в рамках алго- 
ритма типа рассмотренного выше алгоритма половинного деле- 
ния, где следует положить 1(Б):= Г (с) при /(а)/(с)<0. Длина 
промежутка локализации корня при этом может не стремиться к 
нулю, поэтому обычно счет ведется до совпадения значений с на 
двух соседних итерациях с точностью = (лучше, с точностью 


а если 0<т<|/’(х]<М Ухе[а,Ё]; обоснование этого 
—т 
критерия см. в [61]). 


Рис. 5.4. Приближения к корню нелинейного уравнения по методу хоро 


Так как для линейной функции Х(х) метод хорд дает 
корень & точно за один шаг при любой длине отрезка [а,Ь], то 
можно рассчитывать на его довольно быструю сходимость, если 
1 (х) близка к линейной. При определенных достаточно жестких 
условиях можно доказать соответствующие утверждения о моно- 
тонной сходимости, получить более точные оценки и упростить 
алгоритм (см., например, [61]). Однако в общем случае, если на 
функцию Х(х) не накладывать дополнительных ограничений, 
может оказаться, что метод хорд будет проигрывать в скорости 
методу половинного деления; чтобы убедиться в этом, достаточ- 
но взглянуть на рис. 5.4, демонстрирующий возможное поведе- 
ние нескольких приближений по методу хорд. 
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5.3. ТИПЫ СХОДИМОСТЕЙ ИТЕРАЦИОННЫХ 
ПОСЛЕДОВАТЕЛЬНОСТЕИ 


Чтобы более объективно судить о скорости сходимости тех 
или иных итерационных методов, введем следующие понятия [68 


и др.]. 
Пусть некоторый итерационный процесс, генерирует после- 


довательность (хх о, имеющую пределом х 


Определение 5.1. Сходимость последовательности 


(хх) к х называется линейной (соответственно, итера- 
ционный процесс — линейно сходящимся), если существу- 
ет такая постоянная С е (0, 1) и такой номер Ко, что 


«С | У >Ю, (5.5) 


* 
|: Ик 
и сверхлинейной, если существует такая положительная 


последовательность (С Уно, что С; > ди 
= > 


хр < СХ” -ж| УЖЕ №. (5.6) 


Определение 5.2. Говорят, что последовательность 


* 
(хх) сходится к х по меньшей мере с р-м порядком (со- 


ответственно, итерационный процесс имеет по мень- 
шей мере р-й порядок), если найдутся такие константы 


С>0ир>1, что 


ры С” | (5.7) 


при всех К Е №, начиная с некоторого К = Кд. 


Фиксируя в определении 5.2 значение р=1, видим, что ли- 
нейно сходящийся процесс можно называть процессом первого 
порядка; значению р=2 в (5.7) соответствует квадратично 


* 
сходящийся процесс, р=3 означает кубическую сходимость ) 


К линейной сходимости применяют также термин сходи- 
мость со скоростью геометрической прогрессии. Объяснение 


Ел 
) В качестве известных примеров методов высоких порядков в про- 
странстве В„ следует обратить внимание на изученное в $ 3.6 семейство 
итерационных процессов обращения матриц. 
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ему можно найти в том, что определяющее линейную сходи- 
мость неравенство (5.5) между абсолютными погрешностями 


(К +1)-го и К-го приближений к предельной точке х означает 
существование последовательности положительных чисел &х, 


мажорирующих эти погрешности и связанных соотношением 
=р+1 = СЕр, Т.е. являющихся членами геометрической прогрессии 
со знаменателем С =21:1/=х (= соп$®). Отсюда следует также ес- 
тественность в определении 5.1 условия С <1, чтобы последова- 
тельность погрешностей была убывающей, иначе и речи не мо- 
жет быть о сходимости (в определении 5.2 для предельного слу- 
чая р=| также следует ограничить С единицей; при р>1 в 
этом, вообще говоря, нет необходимости; проанализируйте, по- 
чему?). 

Если требуемой в неравенстве (5.5) константы С не удается 
найти, но установлено неравенство (5.6) с Су в ‚ Се(о, 1), то в 


этом случае говорят об асимптотически линейной сходимости 
(пример такой сходимости дает степенной метод в $ 4.4 или рас- 
сматриваемый далее в $ 6.4 метод Бернулли). Аналогично можно 
определить асимптотически р-й порядок. 

Имеются и другие понятия и термины, позволяющие более 
тонко классифицировать сходимость итерационных последова- 
тельностей и рассматривать ее как бы под разными углами зре- 
ния (см., например, [139, 140, 176, 178]). Как правило, они вво- 
дятся в более общем случае конечномерных или бесконечномер- 
ных нормированных пространств. Ничто не мешает и данные 
здесь определения распространить на многомерный случай, дос- 
таточно лишь элементы последовательности (х) и предельный 


* 
элемент х считать и-мерными векторами (п>1) или матрица- 
ми, а вместо модуля использовать норму. 

Среди нескольких способов охарактеризовать скорость схо- 
димости итерационных последовательностей наиболее четко 
оформились два способа: опирающиеся на 4-сходимость (от 
англ. диойеи! — частное) и на г-сходимость (от англ. гоой — 
корень). Происхождение этих терминов можно связать соответ- 
ственно с признаками Даламбера (через отношение) и Коши (че- 
рез арифметический корень), применяемыми для установления 
абсолютной сходимости ряда 


хо +0 -х0)+ (хо -х)+Й +(% —х1)-+й 5 (5.8) 


что равносильно установлению сходимости данной последова- 
тельности (х,), так как сходимость ряда (5.8) означает сущест- 
вование предела его частичных сумм 


1=х0, 52 =, Э3=х2, Й, Эумнхь, Й 
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Четкие определения и различия между этими двумя типами 
сходимостей можно найти в [139]; более существенно эти разли- 
чия проявляются в многомерном случае. Здесь же главное пони- 
мать, что представление о порядке сходимости того или иного 
метода важно для возможности сравнить его с другими; более 
точно для этого подходит знание порядка а-сходимости (что и 
определено выше), порядок же г-сходимости говорит лишь о на- 
личии такой последовательности положительных чисел, которая, 
сходясь к нулю с этим порядком, мажорирует последователь- 
ность величин |" —хк|. Не вникая в тонкости, можно сказать, 
что обычно, изучая итерационный метод, устанавливают факт 


сходимости итерационной последовательности (хх) к искомому 
* 


элементу х и получают апостериорные и априорные оценки по- 
грешности, а о порядке метода (в том или ином смысле, не все- 
гда уточняя, в каком) судят или на основе неравенства типа (5.7), 
или по априорной оценке погрешности вида 


* Г 
х — ж4| < СУР | (5.9) 


где С>0, ие (0,1) — некоторые константы, а р>1 — порядок 
метода, или по неравенству вида 


енг хе Ср фи, (5.10) 


показывающему скорость сближения членов итерационной по- 
следовательности и являющемуся ключевым для установления 
сходимости и получения оценок погрешностей. Чаще всего, раз- 
ные способы приводят к одному и тому же значению р, хотя это 
и не гарантировано. 


Коснемся еще одного аспекта понятия сходимости итераци- 
онного метода. В приведенных выше определениях отождеств- 
лялись сходимость итерационного процесса и сходимость итера- 
ционной последовательности, порождаемой этим процессом; при 
этом негласно считалось, что последовательность (х,) уже как 
бы фиксирована заданием начальной точки хо. Больший же ин- 
терес представляет сходимость множества всевозможных итера- 
ционных последовательностей, генерируемых итерационным ме- 
тодом при варьировании хо в границах некоторой области. Ите- 
рационные методы, дающие в пределе решение данной задачи 
при любом начальном приближении хо, называются глобально 
сходящимися. Если же сходимость итерационной последова- 
тельности (хх) к искомому элементу х’ имеет место лишь при 
задании хо из некоторой, вообще говоря, достаточно малой 
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окрестности х* ‚ то соответствующий итерационный метод назы- 
вают локально сходящимся. 

Так, рассмотренные выше методы дихотомии можно отне- 
сти к глобально сходящимся методам, так как с их помощью все- 
гда можно получить какой-нибудь из корней уравнения Г(х)=0, 
если начать итерационный процесс с отрезка [а, ] любой длины, 
входящего в область непрерывности /(х), лишь бы было выпол- 
нено условие /(а)Г(Ь)< 0. При этом, как видно из оценки (5.3), 
имеющей ‘форму (5.9), метод половинного деления нужно счи- 
тать линейно сходящимся методом, т.е. он сходится со скоро- 
стью геометрической прогрессии со знаменателем 4 = 0.5 и име- 
ет [186] среднюю скорость сходимости — та = 12. Метод хорд 
также является методом первого порядка и в зависимости от 
свойств Г(х) может иметь как большую, так и меньшую, чем 
2, среднюю скорость (часто большую). 


5.4. МЕТОД НЬЮТОНА 


Одним из популярнейших итерационных методов решения 
нелинейных уравнений, что связано с его идейной простотой и 
быстрой сходимостью, является метод Ньютона ). Правило по- 
строения итерационной последовательности (х’) здесь получа- 
ют или из геометрических соображений, откуда другое название 
этого метода — метод касательных, говорящее само за себя, 
или из аналитических путем подмены данной нелинейной функ- 
ции ее линейной моделью на основе формулы конечных прира- 
щений Лагранжа или формулы Тейлора, в связи с чем метод 
Ньютона также называют методом линеаризации. В любом 
случае, говорить о нахождении нуля функции Х(х) методом 


Ньютона можно лишь в предположении, что данная функция об- 
ладает достаточной гладкостью. 


Для простоты будем считать, что функция /(х) дважды 
дифференцируема на отрезке [а,Ь], содержащем корень & урав- 
нения (5.1). 

Пусть хх в [а, 6] — уже известный член последовательности 


приближений к &, полученный конструируемым методом (или 
заданное начальное приближение хо при А =0). Для любого х из 
[а.Б] можно записать формальное представление Х(х) по 
формуле Тейлора 


* 
) В зарубежной литературе его часто называют методом Ньюто- 
на-Рафсона [68, 115, 140, 176]. 
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Год = Гон) биде Фа -м?, ба 


где ©; =[а, Ь] — некоторая точка между х и ху. 
Так как корень & — потенциально произвольная точка от- 
резка [а,Ь], то разложение (5.11) справедливо и для х=&, т.е. 


существует точка ®, =®©, такая, что 


Под им ДЕ 


Но /(2)=0, и если точка ®,; известна, то корень & можно точ- 
но найти из квадратного уравнения 


бд дем)? 0. = (52 


Считая, что значение х; близко к &, т.е. разность &—хх по мо- 
дулю достаточно мала, можно рассчитывать, что величина 
(Ех )? будет тем более малой. На этом основании отбросим в 
(5.12) последнее слагаемое и подменим квадратное уравнение 
(5.12) линейным уравнением. Естественно, что при этом будет 
найден не корень &, а некоторая другая точка, которую обозна- 
ЧИМ Х{-+1. 

Таким образом, итерационный процесс Ньютона определя- 
ется линейным уравнением 


Лок) + Л’ Хх -хь)=0 (5.13) 
или в явном виде формулой 
_ 7 @) 
Г’) 
где К=0,1,2,й и предполагается, что по крайней мере на эле- 


ментах последовательности (хк) первая производная данной 


* 
функции в нуль не обращается ). 


Если в равенстве (5.13) фиксированную точку ху+1 заме- 
нить переменной х, а 0 в правой части — переменной у, то в 


ХА = ХА (5.14) 


* 

) Как видим, процесс вычислений по методу Ньютона не требует 
знания второй производной. Можно обойтись без нее и при выводе (дру- 
гим способом), но при этом усложняется изучение метода. 
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полученном легко узнать уравнение касательной к кривой 
у= /(х), проведенной к ней в точке (хх; /(хь)). Отсюда гео- 
метрический смысл метода Ньютона: приближения к корню & 
совершаются по абсциссам точек пересечения касательных к 
графику данной функции, проводимых в точках, соответст- 
вующих предыдущим приближениям (рис. 5.5). 


Рис. 5.5. Приближения к корню нелинейного уравнения 
методом касательных 


Изучение сходимости метода Ньютона (осуществимость 
процесса вычисления элементов последовательности (х’) по 
формуле (5.14) в пределах заданного отрезка, сходимость к кор- 
ню & данного уравнения, порядок метода, оценки погрешности и 
критерии окончания процесса построения приближений, условия 
на выбор начального приближения) проводится при более огра- 
ничительных требованиях к данной функции /(х). 

Интуитивно ясно (из вида формулы (5.14), рассуждений при 
ее выводе и из ее геометрического смысла), что сходимость (хх } 
к & будет тем быстрее и говорить о ней можно тем увереннее, 
чем ближе функция Г(х) к линейной и чем круче ее график пе- 
ресекает ось абсцисс; так что есть смысл потребовать от Х(х), 
чтобы по модулю вторая ее производная была ограничена свер- 
ху, а первая — снизу. При этих условиях обратимся сначала к 
исследованию быстроты сходимости итерационного метода 
Ньютона (5.14) в предположении, что факт его осуществимости и 
сходимости к корню & сомнений не вызывает. 
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Теорема 5.4. Пусть функция Г(х) удовлетворяет ус- 


ловиям 
[7'(х]>а>0 
(А) Е Ухе[а,Ь]. 


Тогда, если члены последовательности (х\ ), определяемые 
методом Ньютона (5.14), при любом фиксированном 
КЕ № принадлежат отрезку [а,Б] и эта последователь- 
ность сходится на [а,Б] к корню & уравнения (5.1), то 
справедливы неравенства (УК е №): 


нм, (5.15) 
[9 


2 
Ре —ж |. (5.16) 
2а 


(Первое из этих неравенств в соответствии с определением 5.2 
позволяет считать (5.14) методом второго порядка, а второе, 
являясь апостериорной оценкой погрешности, может служить в 
качестве критерия останова процесса вычислений). 


Доказательство. Отметим, что требование принад- 
лежности точек х; отрезку [а,Ь] дает право пользоваться огово- 


ренным условиями (А) поведением данной функции в этих точ- 
ках и их малых окрестностях. 

Подставляя в правую часть формулы (5.12) вместо нуля ле- 
вую часть равенства (5.13) (оба равенства истинны для рассмат- 
риваемых точек хх, ху+1), имеем: 


Го - ГО Е -я 2 = Х'(хь )хьы - Л'кхь. 


Это равенство можно записать в виде точной связи между ошиб- 
* 
ками А-го и (А+!) -го приближений ): 


/"©,) 
ть В, (5.17) 


из которой, переходя к модулям и привлекая условия (А), полу- 
чаем первое из доказываемых неравенств. 


а 


* 

) Для элемента х„.| последовательности (х») приближений к кор- 
ню & уравнения /(х)=0 величину &-—ху.1 называют ошибкой, ху +1 — Хх 
— поправкой, а Г(хь+1) — невязкой. 
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Для доказательства второго неравенства сначала установим 
связь между невязкой (А +1)-го приближения и разностью сосед- 
них (А-гои (К +1)-го) приближений. С этой целью в формулу 
Тейлора (5.11) подставим х= ху. 1. Имеем 


бы) = оч) бабы 0+7 6 Дым, 


и воспользуемся тем, что согласно (5.13), первые два слагаемых 
правой части равенства в совокупности дают нуль. Таким обра- 
зом, 


Три 2 
И) ный (5, Ах =) 
и значит, 
ИО кн жк. (5.18) 


Применим теперь формулу Лагранжа к разности 
(2) - ТО). Согласно этой формуле, между точками & и хр +1 
найдется точка т/-1 такая, что 


1) - Ло) = (ых). 


Принимая во внимание, что /(&)=0, а также условия (А), 
получаем неравенство между абсолютными величинами невязок 
и ошибок приближений: 


| < Ци ). 
[04 


Усилив его с помощью неравенства (5.17), приходим к доказы- 
ваемой оценке (5.16). 
Теорема полностью доказана. 


Замечание 5.2. Последнее неравенство, справедливое для прибли- 
жений х/.1 к нулю & дифференцируемой функции /(х) независимо от 


способа их получения, обосновывает контроль точности по невязкам, а 
именно, оправдывает критерий окончания итерационного процесса 


[72% <= > &=х, с точностью =, 


если в окрестности & выполняется требование | /'(х)] > 1, и говорит о не- 


1 

обходимости учитывать множитель — , т.е. добиваться выполнения нера- 
[24 

венства 


[кк <а=, если а<1. 
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Чтобы выяснить, при каких условиях на выбор начального 
приближения хо начинающаяся с него последовательность (хх), 
генерируемая методом Ньютона (5.14), будет сходиться к корню 
&, проитерируем формально неравенство (5.15). Имеем: 


при ё=0 |< Еж; 
2“ 


2 и 
при ЕР < жур; 


2а 
ео ВВГ 
при еа еыР 5 [2] К-ж 


далее по индукции получаем 


1+2+22+й +21 р 
Ея.) Еж" = 
2а 
Ре ›^ 
-(^) > й “2. ве. 
-(2 [2 —хо| ег Е-хо[, 
т.е. при любых КЕМ 
2<( В 2 
вх 56-0] - (5.19) 


Отсюда следует, что 
р 
хр >, если — Е -х0|<1. 
2“ 


Таким образом, появилась возможность судить о том, на- 
сколько далеко от корня & можно брать начальное приближение 
хо в зависимости от свойств данной функции Г(х), и по априор- 


ной оценке (5.19) заранее подсчитывать число итераций, доста- 
точное для вычисления корня с заданной точностью, если есть 
оценка близости хо кё. 


Теорема 5.5. Пусть для функции Т(х) на отрезке 
[а,Ь] выполнены условия (А). 


209 


2 2 
Тогда, если интервал /:= Ё ат. ё ‚т содержит- 
ся в [а,Ь], то при произвольном выборе ху из Л для опреде- 
ляемой методом Ньютона (5.14) последовательности (х) ): 


0) ххеЕУ УКЕМ; 
2) З Шт ль =& и 1(@)=0; 
Ко 
3) справедливо утверждение теоремы 5.4 и оценка (5.19). 


Доказательство. Прежде всего заметим, что условие 
хо Е / равносильно неравенству 


а, (5.20) 
2а 


к которому мы пришли выше, анализируя неравенство (5.19) 
(рис. 5.6). 


Рис. 5.6. Промежуток выбора начальной точки в методе Ньютона 


Покажем осуществимость процесса (5.14) в интервале .Л. 
Так как хое/с[а,Ь], то, согласно условиям (А), 
Г'(хо)=0, и значение х, по формуле (5.14) может быть получе- 
но. Более того, справедливо неравенство (5.15) при А =0. Следо- 
вательно, 
2а 2 2а 
Е 


Ехо =? < 


т.е. хл ЕЛ. Аналогично из индукционного предположения, что 


) 


2а 
хкЕУ при некотором КЕМ, т.е. что вм <, используя 


(5.15), получаем: 


Ех < 
[94 


2)” _2а 
2а 


=— —>> жнеу. 
В 


В 
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Итак, согласно принципу математической индукции, все 
элементы последовательности (х’) лежат в /<[а,Ь], и значит, 
можно воспользоваться неравенством (5.19), из которого тут же 
следует, что & = Штхх , и заключение предыдущей теоремы. 

То, что точка & — середина заявленного в теореме интер- 
вала ./ — есть корень уравнения (5.1), если заранее это неиз- 
вестно, устанавливается переходом к пределу в формуле (5.14) (с 
учетом условия /’(х)=0 Ухе[а, Ь]). 


Слабым местом только что доказанной теоремы 5.5 являет- 
ся то, что точкой отсчета при построении промежутка примени- 
мости метода Ньютона служит корень &, который как раз и не- 
известен. Более естественно за центр такого промежутка прини- 
мать некоторую конкретную точку хо — начальное приближе- 
ние, полагая по тем или иным соображениям (например, геомет- 
рическим), что в ее окрестности должен быть корень. Имеется 
ряд теорем подобного типа (см. [99, 102, 129, 140, 158] и др.). 
Как правило, им присуща некоторая громоздкость и трудная 
проверяемость условий. 

Заменив условия (А) на требование знакопостоянства пер- 
вой и второй производных данной функции, означающих моно- 
тонность и определенную выпуклость ее графика, докажем про- 
стую теорему несколько иного плана. 


Теорема 5.6 [61]. Пусть на отрезке [а,Б] функция 
Г(х) имеет первую и вторую производные постоянного 
знака и пусть 


Л(а)/()<0. 


Тогда, если точка хо выбрана на [а,Б] так, что 


(хо )/"(хо)> 0, (5.21) 


то начатая с нее последовательность (ху), определяемая 
методом Ньютона (5.14), монотонно сходится к корню 
ЁЕ(а, Ь) уравнения (5.1). 


Доказательство опирается на теорему Вейерштрасса 


о сходимости монотонной ограниченной последовательности. 
Положим, для определенности, что 


Г'<)>0 и Г”’(х)>0 Ухе[а,Ь]. 
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Тогда /(а)<0, Х(Ь) > 0, и в качестве начальной точки хо, удов- 


* 
летворяющей условию (5.21), ) можно взять любую точку из 
промежутка (2, ] ( наличие корня &, единственного в (а, Б), ус- 


ловиями теоремы обеспечено), и при этом ху из (&,Ь] будет 


1©%)>0. 
Покажем ограниченность последовательности (х„) снизу и 
ее монотонное убывание. Из равенства (5.12) при А =0, т.е. из 


1 2 
(хо) +7 "Со 6 -х)+5./"(Фо 8 — хо) =0, 
В силу положительности последнего слагаемого, следует, что 


(хо )+ Ло 6-х) < 0. 


Отсюда, учитывая положительность /’(х), имеем 


Е ео) 
Л'(хо) 
Это неравенство показывает, что 
<х] =^0 А 
Ло) 


(значит, /(х1)> 0). По индукции устанавливаем, что 
Е УК е №, 


т.е. последовательность (х„) монотонно убывает и ограничена 
снизу самим корнем &, следовательно, имеет предел. Сходи- 
мость (хр) именно к корню, как и в предыдущей теореме, полу- 


чаем переходом к пределу в равенстве (5.14). 
Остальные комбинации знаков производных рассматрива- 
ются аналогично. Теорема доказана. 


Замечание 5.3. Нарушение условия Фурье (5.21) на выбор началь- 
ного приближения хо при выполненных требованиях к знакопостоянству 


производных может отразиться лишь на первом приближении: его пере- 
бросит через корень & на другую часть отрезка [а, Ь] (рис. 5.7). Если при 
этом х| не окажется за пределами отрезка [а, 5], то далее итерационный 


* 
) Называемому иногда условием Фурье. 
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процесс Ньютона пойдет монотонно (сформулируйте самостоятельно ана- 
лог теоремы 5.6 без условия Фурье). 


Рис. 5.7. Поведение первых приближений по методу Ньютона 
при нарушении условия Фурье на выбор хо 


Обратимся вновь к зафиксированной теоремами 5.4 и 5.5 
квадратичной сходимости метода Ньютона, которая имеет место 
и в условиях теоремы 5.6. О поведении такого процесса можно 
получить наглядное представление из оценки (5.19), схематично 
записанной в виде 


К 
Еж С-”, 
где уе (0,1) (см. (5.20)), а <= — некоторая положительная 


постоянная. Допустим, что функция Г(х) и приближение ху к 
корню & таковы, что С =1, аи=0.1, т.е. абсолютные погрешно- 


сти убывают по закону Ех, |< 0.12. Подставляя сюда 
&=1,2,3,й , имеем: Е-ж|<10-2, -х2|<10-“, [Е-хз|<10-8, 
Е-х4|<106 итд. 

Как видим, квадратично сходящийся процесс в идеале, т.е. 
если он реализуется точно, должен давать удвоение числа вер- 
ных знаков на каждой итерации, начиная с некоторой. Такой 
высокий темп установления верных цифр искомого корня не 
только позволяет получить корень с большой точностью сравни- 
тельно небольшим количеством вычислений, но и обеспечивает 
хорошую численную устойчивость метода, а также меньшую 
критичность к правилу окончания итерационного процесса (час- 
то здесь применяют упрощенное правило останова 


Ме -хк|5= > бу). 
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5.5. ПРИМЕНЕНИЕ МЕТОДА НЬЮТОНА И 
К ВЫЧИСЛЕНИЮ ЗНАЧЕНИИ ФУНКЦИИ 


Элементарные функции, чаще всего, вычисляются с помо- 
щью приближения их подходящими многочленами (0б этом еще 
пойдет речь далее, см. гл. 9). В некоторых же случаях для этих 
целей применяют итерационные методы, в частности, базирую- 
щиеся на методе Ньютона. 

Пусть требуется найти значение заданной функции ф в за- 
данной точке а. Считая а произвольной точкой из области О(ф) 
или какой-либо ее подобласти, функциональное соответствие 


х= (а) 
зададим неявно уравнением 
Е(а, х)=0 (5.22) 


таким, чтобы: 1) оно было локально эквивалентным (в окрестно- 
сти точки а) данному; 2) функция К была дифференцируема по 
второму аргументу; 3) функции Р и Е’ были легко вычислимы. 

При каждом фиксированном а уравнение (5.22) можно счи- 
тать уравнением типа (5.1) и получать приближенно его корень 
— требуемое значение х = ф(а) — методом Ньютона (5.14). Для 
уравнения (5.22) формула (5.14) принимает вид 


Е(а, ху) 
Ва, ХК ) 
где к=0,1,2,й ‚ахо — задаваемое начальное приближение к ф(а). 


Хи = ХА (5.23) 


В качестве более конкретного примера применения такого 
подхода выведем из формулы (5.23) правило Ньютона вычис- 
ления арифметических корней. 

Пусть а — данное положительное число, а п>2 — данный 
натуральный показатель корня. 

Очевидна связь между задачей вычисления вещественного 


значения 
х=Ча 
и задачей нахождения положительного корня уравнения 
х"-а=0. 
Приняв Е(а,х):=х”-а, находим Е'’(а,х)=их”!, и согласно 
(5.23), процесс приближений к а определяем формулой 
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или в другом виде 


Хр == ("-1)х» —— 
=: 
где =0,1,2,й ‚ах > 0 задается. 
Еще из глубокой древности известен частный случай полу- 
ченного правила Ньютона — процесс Герона 


а 
Хр => Хх = , 
|. 


применяемый для извлечения квадратных корней. Здесь 
Е(а, х)=х?-а, Е\(а, х)=2х, Е"(а, х)=2, те. при х>0 выпол- 
няются предварительные условия теоремы 5.6, и для монотонной 
сходимости (хр) к ^/а достаточно лишь удовлетворить условию 


Фурье (5.21), т.е. взять хо таким, чтобы было хо >а. Легко убе- 


диться, что это условие будет выполнено, если взять хо = 2058. 


= 0.5( 1+1) 


если т — четное, и %хд ‚ если т — нечетное, где 


тей такое, что а=2"4 и 4Е[0.5,1] (а «зажимается» между 


ме * 
двумя соседними целыми степенями двойки: 2т-1 <а< и” ). 


Другим примером использования метода Ньютона в форме 
(5.23) может служить вычисление обратной величины данного 
числа а, иначе говоря, выполнение операции деления с помо- 
щью других арифметических операций. 


1 
Аналогично предыдущему зададим искомое х=-— как ко- 
а 


рень уравнения 


* 
) Не заботясь о монотонности последовательности приближений, 


обычно ограничиваются заданием хо =2105". 
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1 
Подставляя Р(а, х)=а--— и Е, (а, х) = в (5.23), после упро- 
х х 


* 
щения получаем итерационный процесс без делений ) 
ХК =хк(2-ах, ), к=0, Ь 2, й . (5.24) 


Здесь также считаем а и х положительными, и очевидно, что 
для любых х> 0 


Е'>0, а "= 0, 
х 


т.е. условия теоремы 5.6 будут выполнены, если взять 
1 
хоЕ [о — | 
а 
Непосредственное изучение процесса (5.24) показывает, что 


область выбора начального приближения хо) может быть в два 


раза расширена (правда монотонность приближений при этом 
уже не гарантируется). 

Действительно, рассмотрим связь между поправками 
(К-+1)-го и К-го приближений: 


| | 5 И ь 
С 2 =——2х» + ах «(1-м ) 
а а а 


(равенство типа (5.7), подтверждающее, что (5.24) — процесс 
второго порядка). Отсюда последовательным итерированием 
приходим к равенству 


1 1 к 
хр = (аж), 
Я а 


1 
из которого следует, что сходимость (хх; ) к — имеет место в слу- 
2 
чае, когда ||-ахо| < 1, т.е. при хо Е| 0, = |. 
а 
Обычно за начальное приближение, удовлетворяющее ус- 
1 в 
ловию хо < (о, — |, берут число 2", где тей то же, что и в 
а 
предыдущем примере. 
*) 
Легко увидеть аналогию между этим процессом и рассмотренным 


ранее процессом Шульца второго порядка для обращения матриц (сравни- 
те (5.24) с (3.34) при т=Т). 
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5.6. МОДИФИКАЦИИ МЕТОДА НЬЮТОНА. 
МЕТОД СЕКУЩИХ 


Вновь обратимся к теоремам 5.4—5.6 о сходимости метода 
Ньютона. Их условия предполагают неравенство нулю произ- 
водной данной функции /(х) на промежутке [а, 6], где приме- 
няется метод. А это означает, что они регламентируют примене- 
ние метода Ньютона только для нахождения простых нулей 
функции Х(х), поскольку для кратного корня & уравнения (5.1) 
имеет место равенство /’(&)=0. Действительно, пусть & — 
т-кратный корень (т>2); тогда функция /(х) представима в 

* 


виде 
Хх) =(-6)" ло) 


и ее производная /’(х) = (х-&)" 1. [т (х)+ (х-2) С обра- 
щается в нуль при х=ё. 

Согласно (5.14), формально нужно, чтобы производная не 
равнялась нулю в точках х; последовательности приближений, в 
предельной же точке & допустимо обращение производной в 
нуль. Как показывает пример 5.3, итерационный процесс Ньюто- 
на может сходиться и в этом случае, т.е. когда & является крат- 
ным корнем уравнения (5.1), но сходимость при этом — только 
линейная. 

Если заведомо известно число т — показатель кратности 
корня &, то для ускорения сходимости метода Ньютона в форму- 
лу (5.14) рекомендуется ввести корректирующий множитель т: 


У (хь) 
их 
Го») 
Такую модификацию будем называть методом Ньютона- 


Шрёдера ). Доказательство сверхлинейной сходимости этого 
метода можно найти в [158], где он называется методом Нью- 
тона с параметром, а также в [176] ив [140], где имеется ссыл- 
ка на содержащую этот метод работу Э.Шрёдера. 


ХЕХ . (5.25) 


* 
) Это представление здесь принимается за определение т-й крат- 
ности корня &. Часто & считают корнем кратности т, если 


ПЕС = 5-0 (2) =0,а 1 (2) = 0 (см., например, [158]). 


** 
)в [72] первое введение параметра т в формулу (5.14) приписы- 
вается Е.Бодевигу (1949 г.), в связи с чем (5.25) там называют методом 
Ньютона-Бодевига. 
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Пример 5.3. Для функции 1@«)=(—12 корень & =1 — двукрат- 
ный. Подстановка этой функции /(х) и ее производной /’(х)=2(х-1) в 
формулу (5.14) определяет процесс 
хк-1 
хьы = 2 —, (5.26) 


или проще, 


1 
ХАН =—(хь +1). 
2 
Если начать его с хо =2, то на каждой последующей итерации будем по- 
лучать все более близкие к & =1 значения: 
х1=1.5, х2=1.25, хз =1.125, хд =1.0625, Й. 


Вычитая | из обеих частей (5.26), приходим к равенству 


1 
ХК Ня = 


означающему, что сходимость последовательности (ху) к |1 — точно ли- 
нейная. В то же время, введение множителя т=2 в (5.26) в соответствии с 
(5.25) приводит к стационарной последовательности х,., =1 \УАЕ\М,. 


Не следует думать, что из (5.25) всегда будет получаться 
хр+1 =&. Рассмотрим менее утрированный пример. 


Пример 5.4. Функция /(х)= х(х — 12 с тем же двукратным корнем 
& =1 с помощью формул (5.14) и (5.25) порождает следующие процессы: 


метод Ньютона метод Ньютона_Шрёдера 
2 ХА +1 

к-т = а т? Хк+1 кА 7; 

хо =2, хо =2, 

= хм =1.2, 

хо = 1.347368, хо = 1.000116, 

хз =1193517, хз = 1.000000. 


Налицо эффективность коррекции метода Ньютона введением в него по- 
казателя кратности корня. 


Цель всех последующих видоизменений основной формулы 
(5.14) метода Ньютона — уменьшение вычислительных затрат, 
связанных с необходимостью вычисления производной на каж- 
дом итерационном шаге. 
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Самый простой выход на этом пути — использование на 


1 
каждом шаге одного и того же шагового множителя 7 ты, 
хо 
счет по формуле 
х 
ПИ т (5.27) 


. 
Г’) 
Такой метод называют модифицированным или упрощенным 


методом Ньютона . Он имеет очевидную геометрическую ин- 
терпретацию: в начальной точке хо проводится касательная к 
графику у= /(х) (первый шаг основного и модифицированного 
методов Ньютона совпадают), а во всех последующих точках 
х|, х2,Йй проводятся прямые, параллельные этой касательной 
(рис. 5.8). 


Рис. 5.8. Приближения к корню нелинейного уравнения 
модифицированным (упрощенным) методом Ньютона 


При такой модификации метод Ньютона утрачивает высо- 
кую скорость сходимости (процесс не реагирует на изменение 
наклона кривой к оси абсцисс при приближении к корню) и вме- 
сто квадратичной имеет лишь скорость сходимости геометриче- 
ской прогрессии, что станет очевидным несколько позже (см. $ 6.1). 

На получение сверхлинейной скорости сходимости при ви- 
доизменении метода Ньютона (5.14) можно надеяться в случае, 
когда /’(х») при каждом А е М подменяется не одним и тем же 


числом /“’(хо), а некоторым близким к /’(хх» ) значением, кото- 
рое может быть найдено (при каждом К свое) через значения 


* 
) Иногда его называют еще огрубленный метод Ньютона [158]. 
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* 
данной функции. Для таких аппроксимаций ) Х’(хь) можно ис- 
пользовать, например, определение производной. Имеем: 


от Де +) ЛО) 
#0 й 


и при малых Й (произвольного знака) получаем приближенное 
равенство 


Г'@ь)= (хх нь 


позволяющее производную приближенно подменять так назы- 
ваемым разностным отношением (подробнее об этом см. 
гл. 13). Подстановка (5.28) в (5.14) приводит к итерационной 


формуле 


(5.28) 


____ Х@в-й 
. ) 
Л (хк +1) Л(хь) 
где К=0, 1,2,й ‚ай — малый параметр, которым должен распо- 
рядиться вычислитель. 

Ясно, что при каждом А в формуле (5.28) может быть свое 
значение Й, т.е. в формуле (5.29) вместо постоянного параметра 
й имеет смысл использовать связанный с номером итерации па- 
раметр Йх, ‚ т.е. вести вычисления по формуле 


о У 
к +1 )- Лк) 


Итерационный метод, определяемый формулами (5.29) или 
** 
(5.30), назовем разностным методом Ньютона 


Так как равенство (5.28) можно сделать сколь угодно точ- 
ным за счет малости шага й разностного отношения (теоретиче- 
ски; практически это далеко не так из-за потерь точности при 
вычитании близких чисел), то по непрерывности можно утвер- 
ждать асимптотически квадратичную скорость сходимости раз- 
ностного метода Ньютона при определенных условиях. 

Рассмотрим соображения, которыми следует руководство- 


ХА = к (5.29) 


(5.30) 


ХЕ = ХЕ 


® 
) Арргохтаге (лат.) — приближаться. 
Ж* 
) Другие названия — конечноразностный [68] и дискретный 
[139] метод Ньютона. Сходимость этого метода изучается в [68]; там же 
можно найти рекомендации по сопряжению шага дискретизации Й с точ- 
ностью машинных вычислений. 


220 


ваться при задании последовательности параметров й; в разно- 
стном методе Ньютона (5.30). В любом случае, будем исходить 
из постулата, что с ростом К значения |й;| должны убывать, 
чтобы при приближении х; к корню & производная /’(х») все 
более точно аппроксимировалась разностным отношением 
ох) - Ло) йь . 

Первое, что можно здесь предложить, так это задать какое- 
либо значение йо, а каждое последующее значение параметра 
получать рекуррентным равенством Й;.1=6Их, где бЕ(0,1) — 
некоторое фиксированное число. Например, можно положить 
о =01, И; =0.01, й> =0.001 и т.д. Очевиден недостаток такого 
подхода — отсутствие связи между скоростью сходимости (ху) 
к & и скоростью убывания |й„| (может оказаться, что х; еще не 
имеет достаточной близости к &, а значение |[й; | настолько мало, 
что значения (ху +й;) и Г(хь) реально не различимы; проти- 
воположная ситуация чревата большой потерей скорости сходи- 
мости или, еще хуже, нарушением канонического развития ите- 
рационного процесса). 

Если учесть, что при зафиксированных в теореме 5.4 усло- 
виях (А) Г(х,)->0 с той же скоростью, что и х; —>& (см. нера- 
венство (5.18)), есть смысл полагать в (5.30) й; := Х(хк). Разуме- 
ется, это можно делать на той стадии итерационного процесса, 
когда значения |/(х, } уже достаточно малы (иначе теряет силу 


(5.28)). При таких Й; формула (5.30) принимает вид 


2 
_ (©) 
Лок +7 ))-Л(хь) 
и называется методом Стеффенсена. Подчеркнем еще раз его 


сугубо локальный характер сходимости, но зато сходимость эта 
квадратичная [140, 158]. 


Хр = ХА (5.31) 


При приблизительно равных затратах на вычисление значе- 
ний данной функции и ее производной ни один из рассмотрен- 
ных выше вариантов разностного метода Ньютона не дает выиг- 
рыша по сравнению с основным методом (5.14), поскольку каж- 
дый из них требует два вычисления функции на каждом итера- 
ционном шаге, не увеличивая при этом скорость сходимости. 
Построим такую модификацию метода Ньютона, развивая далее 
его разностный аналог (5.30), в которой на один шаг итерации 
приходилось бы только одно вычисление функции. 

Опираясь на то, что необходимым условием сходимости 
некоторой последовательности х; к пределу &, как это следует 


из (5.8), является сходимость к нулю последовательности 
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разностей х; — ху (причем с той же скоростью, см. (5.10)), по- 
ложим в (5.30) 


Пк = хьл-хк, ОТКуда ху =хХр+йь. 

В результате этого из (5.30) получаем итерационный процесс 

_ еб Хха-хь) 
) 

Ло) -У(ь) 
где К=1,2,3,Й ‚а хуи х| должны задаваться. 
Формула (5.32) определяет новый метод как двухшаговый 
(результат (К -+1)-го шага зависит от результатов А-го и (&-1)-го 
шагов) и на каждой итерации требует вычисления только одного 
значения функции, другое же значение, фигурирующее в этой 
формуле, передается с предыдущего шага. Сравнив (5.32) с фор- 
мулой (5.4), полученной из геометрических соображений, легко 
понять, что ху.| есть абсцисса точки пересечения с осью Ох 
прямой, проведенной через точки (ху_1; Л(ххл)) и (хь; Л(хь)), 
т.е. секущей (рис. 5.9). Отсюда название этого метода — метод 

* 
секущих ). 


ХА = (5.32) 


$ Хо ХЕ ХЕ ХЬ 
Рис. 5.9. Приближения к корню методом секущих 


Можно сказать, что метод секущих и метод хорд определя- 
ются совершенно однотипными формулами, но порождающие их 
идеологии различны, что сказывается на свойствах и скорости 
сходимости генерируемых ими последовательностей приближе- 
ний. 


* 
) В [12] методом секущих называют метод хорд (с фиксированным 
концом). 
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Выясним, по какому закону убывают погрешности прибли- 
жений, получаемых методом секущих (5.32) в условиях (А) тео- 
ремы 5.4. 

Вычитая равенство (5.32) из равенства & =& и применяя в 
знаменателе формулу Лагранжа, имеем: 


Е Лек 1-х) (к) 
ы о )-Л@к) Хм)’ 


где //; — некоторая точка между приближениями х/ и х/_1. Да- 
лее воспользуемся формулой Тейлора, согласно которой можно 
записать 


=Е-х, + (5.33) 


о) Л@+ Г еХх-9+ 76-5, 


откуда при х=хх, 9 =06, с учетом того, что & — корень уравне- 
ния (5.1), следует представление 


= Ге 9+, 8). 


Подставим это в (5.33) и вынесем в правой части общий множи- 
тель &—хь: 


б-ху1 = 


т ти би) Ге, - ч) 


Вновь применяя формулу Лагранжа — теперь к разности произ- 
водных — и переходя к модулям, получаем неравенство 


|1 
(ик) 


Так как для сходящейся к & нестационарной последова- 
тельности (х} ) справедливы неравенства 


ЕЕ, Еж 
то в итоге можно записать искомую СВЯЗЬ погрешностей в виде 
3 
| ЧЕ, 634 


где х и В — константы из условий (А). 


И 
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Ясно, что неравенство (5.34) характеризует метод секущих 
как сверхлинейно сходящийся процесс. Конкретный порядок ме- 
) 


тода секущих устанавливается следующим образом . 
Обозначим для краткости 


_ 38 
5% =Ё-хь С:=— 
2а 
и, используя записанное в этих обозначениях неравенство (5.34) 
2+1 < СЕ, 
получим последовательно несколько первых оценок &;, через 
степени =0 (полагая по определению #1 < 50). Имеем: 
1 2 
при К=1| => <С8150 < исаь) } 
1 
при =2 #3 <СЕоЕ| а у: 
1 5 
при =3 #4 <С3Е) т : 


при ^=4 25 <СЕдЕЗ < у 


при =5 #6 <С5Е4 < (Са) ит.д. 


Обратив внимание на то, что показатели в правых частях 
этих неравенств подчиняются закону «каждый последующий 
есть сумма двух предыдущих», нетрудно доказать в общем виде, 
что 


= < (Сео) к, (5.35) 


** 
где (Ф’) — последовательность чисел Фибоначчи ), опреде- 
ляемая рекуррентным соотношением 


Ф;1=Ф,1-+Фх, к=1.2.3,Й . Фу =Ф! =1. 


* 
) Близкое к данному изложение можно найти в [140]. 


#* р 
) Фибоначчи — псевдоним знаменитого итальянского математика 
Леонардо Пизанского (1180—1240 гг.). 
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Для общего члена Ф,, этой последовательности известна форму- 


ла Бинэ: 
К — (+1 
г | (1+5) ^ [1+5 я 


ФФ: === 
| я 2 


Поскольку с ростом К роль второго члена в выражении Ф») 
становится ничтожной, для достаточно больших значений К на 
основе (5.35) можно считать справедливым асимптотическое не- 
равенство 


(+ 
Е-хк|<Су-и 


где Су и и — некоторые новые постоянные (которые легко вы- 
писать). Полученная оценка вида (5.9) позволяет утверждать, что 
справедлива следующая теорема. 


Теорема 5.7. Метод секущих имеет порядок по край- 
ней мере ыв (= 1.618). 


Замечание 5.4. Для многошаговых итерационных методов иногда 
вводят специфическое понятие порядка сходимости. Согласно [68], 
]-шаговый итерационный метод, генерирующий сходящуюся к & после- 


довательность (ху), называется }-шагово сходящимся с порядком р, 


если | хи СЕ-хь. Так как из неравенства (5.34) после его усиле- 
ния получается 


зв 2 
[жк < -хк-“, 
2а 
то можно сказать, что метод секущих сходится двухшагово квадратично. 


Высокий порядок скорости сходимости метода секущих в 
сочетании с минимальными вычислительными затратами — одно 
вычисление значения функции на один итерационный шаг — 
выводит этот метод на первое место по эффективности решения 
скалярных уравнений вида (5.1) среди прочих итерационных ме- 
тодов. Это подтверждается как теоретическими, так и практиче- 


скими наблюдениями 


* 

) При сравнении с методом Ньютона и другими методами, исполь- 

зующими производные, в [140] предлагается приравнивать работу по вы- 

числению значений функций и ее производных. Единица такой работы в 

[140] называется горнером, а в в единицей объема информацион- 
ного запроса. 
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При применении метода секущих возникают вопросы, свя- 
занные с началом итерационного процесса и с его окончанием. 
Поскольку касательная к кривой есть предельное положение се- 
кущей, выбор начальной точки х( в методе секущих нужно осу- 


ществлять по тому же принципу, что и в методе касательных, 
например, привлекая условие Фурье (5.21); вторая же из началь- 
ных точек х|, требуемая в двухшаговом методе (5.32), может 
быть взята в непосредственной близости от хо (понятие близости 
здесь, разумеется, условно), желательно между точкой ху и ис- 
комым корнем &. 

Окончание счета по методу секущих, учитывая его быструю 
сходимость, можно контролировать с помощью проверок на ма- 
лость модулей невязок, т.е. |Х(х/ }, или поправок [ху —хк-1|. Од- 
нако главное здесь — это суметь вовремя остановить процесс 
вычислений, не дожидаясь момента, когда погрешности вычис- 
лений начнут превосходить погрешность метода вследствие вы- 
читания приближенно вычисляемых близких значений /(ху_1)и 


Г(хь) в знаменателе расчетной формулы (5.32). В этом плане, 


т.е. в численной устойчивости, метод секущих уступает методу 
Ньютона. 


Если почти все рассмотренные выше методы можно отне- 
сти к классу методов линеаризации, имея ввиду, что в их основе 
лежит подмена исходной нелинейной модели линейной, постро- 
енной тем или иным способом, то следующим шагом должно 
быть построение классов методов «параболизации». Квадратич- 
ная модель (парабола) может быть получена, например, по фор- 
муле Тейлора или квадратичной интерполяцией (гл. 8), но в лю- 
бом случае соответствующие итерационные формулы, хотя и 
дают более быстро сходящиеся последовательности приближе- 
ний к корню, либо содержат старшие производные данной функ- 
ции, либо являются слишком громоздкими и сложными как для 
исследования, так и для их применения. 

Более важно обратить внимание на локальную сходи- 
мость таких простых и достаточно быстро сходящихся методов, 
как метод Ньютона и метод секущих, условия которой не так 
часто удается обеспечить. В связи с этим встает задача построе- 
ния гибридных алгоритмов на базе двух или нескольких мето- 
дов, соединяя быструю сходимость одних с глобальной сходимо- 
стью других. Принципы комбинирования методов в таких алго- 
ритмах могут быть различными: можно «стартовать» с глобально 
сходящегося «медленного» метода и подключить быстросходя- 
щийся метод на финише для уточнения значения корня, а можно 
сразу начать процесс вычислений «быстрым» методом, но про- 
водить корректировку получаемых им значений, пользуясь гло- 
бально сходящимся методом. Последний подход порождает, 


например, следующий простейший гибридный алгоритм. 
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Метод Ньютона-—метод половинного деления 
Шаг 0. Задать начальное приближение хо, положить А :=0. 
(к) 
Л'(хь) 


Шаг 2. Если |Х(хь }<| (хи, то ху := Хр; иначе 


Шаг 1. Вычислить Хр = ху — 


ыы 1 = 
ЖЕ = 5% +хк) и возвратиться к началу шага 2. 


Шаг 3. Проверить на останов (работа алгоритма либо пре- 
кращается с &:=х,.1, либо продолжается перехо- 
дом к шагу | с К:=А+1. 


Приведенный алгоритм учитывает, что метод Ньютона вы- 
рабатывает локально правильное направление (убывания функ- 
ции), но продвижение в этом направлении может оказаться чрез- 
мерным, что и корректируется с помощью деления отрезка попо- 
лам, если не выполняется условие релаксации | (ху < [Ск] в 
шаге 2 (рис. 5.10). 


Рис. 5.10. Иллюстрация одного шага гибридного метода 


Ньютона-половинного деления 


1 
1 
1 
1 
1 
Ф ® 


6 Хх Хк+ 


ХК 


Рис. 5.11. Пример поведения гибридного метода 
Ньютона-половинного деления, когда ху+1 дальше от корня & , чем ху 
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Такой гибрид трудно считать глобально сходящимся (рас- 
смотрите, например, его дальнейшее поведение в ситуации, изо- 
браженной на рис. 5.11), но он позволяет расширить границы 
применимости метода Ньютона и хоть как-то вести процесс по- 
иска корня в условиях неопределенности знаков производных. 
Разумеется, этот алгоритм весьма схематичен и требует некото- 
рых усилий на его деталировку. Особенно важно решить, как в 
тех или иных случаях выполнить шаг 3. Большую роль здесь иг- 
рает правильное сопряжение задаваемой точности решения зада- 
чи с погрешностью метода (иначе, с остаточной погрешностью) 
и с точностью выполнения арифметических операций на исполь- 
зуемой вычислительной машине (вычислительной погрешно- 
стью), а также с точностью вычисления значений функций, что, 
вообще говоря, не одно и то же. Важные сведения о таких крите- 
риях окончания процессов поиска корней с привязкой их к ре- 
альным компьютерам можно почерпнуть в книге [68]. 


5.7. ПОЛЮСНЫЕ МЕТОДЫ НЬЮТОНА И СЕКУЩИХ 


Построим новую модификацию метода Ньютона (5.14) ре- 
шения уравнений вида (5.1), введя в него два параметра. В осно- 
ву вывода этой модификации положим геометрические пред- 
ставления. 


в ГО) 


Рис. 5.12. К построению полюсного метода Ньютона 


Возьмем на плоскости Оху некоторую точку Р(с; 4) (назо- 
вем ее полюсом) и через нее и определяемую предыдущим при- 
ближением х, точку (х,;0) проведем прямую (см. рис. 5.12). 
Новым приближением х„.| к корню & уравнения /(х) = 0 будем 
считать абсциссу точки пересечения этой прямой с касательной к 
графику функции у= Х(х), проведенной в точке (ху; /(хь)). 
Составив уравнения указанных прямых 


А(х-ху 
а У= Л (хи (я — хр) + Ло), 
К 
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разрешаем получающееся отсюда приравниванием ординат 


уравнение 
а(х-х,) 
@— ХК 


= Ли) -хь) + ЛО) 


относительно абсциссы х и найденное таким образом ее значе- 
ние называем хх. 1. В результате приходим к итерационной фор- 
муле 


Хк+1 = Х ВН. › К=0,1,2,й . (5.36) 


Эта формула определяет двухпараметрический одношаговый 
метод, который в дальнейшем будем называть полюсным ме- 
* 


тодом Ньютона ) 


хк; Л(хк)) 
(хи; Лк) в 


Рис. 5.13. К построению полюсного метода секущих 


Аналогично, проводя через точки (ху; Г(хк)) и 
(хк; Лок) секущую 
Ло)- и (хр) 


у= Л @ь)+ 
у 


(рис. 5.13), находим ее точку пересечения с прямой, проведенной 
через полюс Р(с; 4) и (ху; 0). Выражение абсциссы этой точки 
пересечения двух прямых задает двухиараметрический двухша- 
говый итерационный процесс 


(х-хк) 


(к) 
Хр = Хр, К=|,2,Й , (5.37 
а 76а 
ХХ С — Хх 


который будем называть полюсным методом секущих. 


= 
) Идея этого метода предложена и опробована П.В.Вержбицким 
(1989 г.). 
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а 

с Хк 
(т.е. при 4 =0) новые методы (5.36) и (5.37) совпадают с базо- 
выми для них классическими методами Ньютона (5.14) и секу- 
щих (5.32) соответственно, следовательно обобщают их, и что 
формула (5.37) может быть получена из формулы (5.36) аппрок- 
симацией производной подобно тому, как формула секущих 
(5.32) была получена из формулы касательных (5.14). _ 

Анализ рисунков 5.12 и 5.13, на которых через ху ‚1 обозна- 
чены приближения по базовым методам (5.14) и (5.32) соответст- 
венно, показывает, что за счет удачного расположения полюса Р 
полюсными модификациями методов Ньютона и секущих можно 
получить лучшее уточнение приближенного значения корня, чем 
посредством базового метода (сравните | — ху] © |&-ху1| на 
том и на другом рисунках ). Нетрудно также представить графи- 
чески ситуацию, когда полюсные варианты будут генерировать 
сходящиеся к корню последовательности, в то время как, напри- 
мер, ньютоновское приближение отбрасывается в бесконечность. 

Изучим поведение погрешности К-го приближения, полу- 
чаемого полюсным методом Ньютона (5.36), в предположении о 
существовании в некоторой окрестности корня & уравнения (5.1) 
(содержащей начальную точку хо) непрерывной второй произ- 
водной функции Х(х). 

Запишем определяющую полюсный метод Ньютона форму- 
лу (5.36) в виде равенства 


к) + о) - Ч Убщы-хж)=0 (5.38) 


СХ 


Легко видеть, что при равенстве нулю выражения 


и воспользуемся тем, что в соответствии с формулой Тейлора 
0= 14) = Лор + Ле -ж) +5", -хь)*, 6.39) 


где 9, — некоторая точка между х; и &. Приравнивая к левой 
части равенства (5.38) правую часть равенства (5.39), после уп- 
рощений получаем следующую связь между ошибками (А +1)-го 
и А-го приближений: 


_ 1") а (хи =) 

© — хи = ЗУ Е ВИ 
Лок) Л’ {е-хь) 

Лишь второе слагаемое в представлении (5.40) ошибки (А +1)-го 
приближения зависит от параметров с и 4, выбор которых ап- 


риори может как ухудшить, так и улучшить типично ньютонов- 
скую связь ошибок (к +1)-го и А-го приближений, определяе- 


мую первым слагаемым (сравните с (5.17)). 


Е (5.40) 


230 


Выразив поправку хх. -—хх из формулы (5.36) и подставив 
ее в равенство (5.40), приходим к другой его форме: 


Е и Е И 
Со о, тои -Рорс-ят 


Так как Г(х») с помощью линеаризации в окрестности корня & 
можно представить в виде 

Лк) = Л) + Лак Ххь 6) = Лак Хх 6) (5.42) 
(при некотором значении т), расположенным между точками хх 
и&), то учет этого в равенстве (5.41) позволяет рассчитывать, по 
меньшей мере, на линейный закон убывания погрешностей ме- 
тода (5.36) при любых значениях параметров с и 4, если только 
знаменатель второй дроби в (5.41) не стремится к нулю при 
К >>. 

Линейная связь (5.42) между невязкой /(х,) и ошибкой 
&-—х,; приближения х; к корню &, рассматриваемая примени- 
тельно к равенству (5.41), говорит о том, что если ординату 4 
полюса Р изменять пропорционально изменению значения 
функции /(х) в текущей точке, то можно рассчитывать на квад- 
ратичную сходимость метода (5.36). Действительно, полагая, на- 
пример, 4 = Л(х»), из (5.41) с учетом (5.42) получаем 


"9, ау 
27“ Лео ою)-Леюе-хь 


что показывает допустимость квадратичной сходимости после- 
довательности (х,). 

При ограниченной снизу абсолютной величине производ- 
ной функции Х/(х) множитель при (Ех)? в равенстве (5.43) 
все же может оказаться большим, если будет слишком малой по 
модулю величина 


ик = Лк) - Ги (е-хь). 
Однако за счет такого выбора другого параметра (т.е. с), при ко- 
тором он изменялся бы согласованно с изменением {и Г’, ве- 


личина и, может быть сделана фиксированной. Например, пола- 
гая 


(5.41) 


6 — хуи = -жь)*, (5.43) 


Лок)-2 
Го: ' 


сх 
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при любом А е № будем иметь значение и; =2. При таком вы- 
боре 4 ис из равенства (5.43) следует равенство 


п ! 2 
_ /"@-+СРаь)) 
в - хи = Ве 
Го) 
означающее квадратичную связь ошибок (К +1)-го и А-го при- 


ближений. К этому же равенству придем и в случае фиксирова- 
НИЯ 


-;)”, (5.44) 


однако, как легко увидеть из рис. 5.12, достаточно ограничиться 
выбором 4 = Г(хь), так как при 4 =-Х(хь) и соответствующем 
значении с получаем симметричный относительно точки (хх; 0) 
полюс, с которым приходим к тому же значению очередного 
приближения ху +1. 

Итогом проведенных рассуждений служит следующая тео- 
рема. 


Теорема 5.8. Пусть корень & уравнения (5.1), на- 
чальная точка ху и элементы последовательности (ху), 
полученной методом Ньютона с подвижным полюсом 


ниям -— ААВ — Е=0,1,2,й (5.45) 
Ск ХЕ 


принадлежит отрезку [а, |, на котором выполняются не- 
* 


равенства 
0<а<|/'(х]<у, |") <. 
Тогда при 
‚)-2 
Ч =. (в), Ск =Хк Рае (5.46) 


быстрота сходимости последовательности (ху } характе- 
ризуется неравенством 


2 
+ 
|<. (5-47) 


*) Сравните с условиями (А) теоремы 5.4. 
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Из представленного теоремой 5.8 результата вытекает сле- 
дующее утверждение. 


Следствие 5.1. Пусть для метода Ньютона с под- 
вижным полюсом (5.45), (5.46) в условиях теоремы 5.8 на- 
чальное приближение хо к корню & уравнения (5.1) выбрано 
так, что 


= р а Е (5.48) 


Тогда имеет место ии (хр) к & саприорной 
оценкой погрешности 


К 
Ех |294? УКЕМ. (5.49) 
В-+у 
2 
Действительно, положив 4 := . итерированием нера- 


венства (5.47) получаем: 
|| 54-х)? = 
22 2 23 
Е -ж 59 Ех < 


2 КЬ-—1 К К 


т.е. 


2 и 
ты 


Последнее неравенство показывает, что требование (5.48) явля- 
ется достаточным для сходимости х; к &, и справедливость 
оценки (5.49). 


Замечание 5.5. Анализируя равенство (5.44), подмечаем, что при 
задаваемом формулами (5.46) способе фиксирования координат подвиж- 
ного полюса Ру (сь; 4х) скорость сходимости последовательности при- 
ближений, генерируемых процессом (5.45), будет выше для функций 
(<), которые в окрестности корня & выпуклы вверх. Можно рассчиты- 
вать, что сходимость (хх) будет сверхквадратичной, если при этом вторая 
производная будет пропорциональна квадрату первой производной, т. е. 
для семейства функций /(х,р,с1,с2), удовлетворяющих дифференци- 
альному уравнению 


Г") ==р(()?, р>0. 
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Легко убедиться, что решением последнего является семейство функций 
1 
ты (стрх+с2), (5.50) 


где с|1, с› — произвольные постоянные, при которых данная функция 
имеет смысл, а р>0 — коэффициент пропорциональности второй произ- 
водной и квадрата первой, каким-то образом влияющий на быстроту схо- 
димости. Ясно, что для функций вида (5.50) оценка (5.47) (и, тем более, 
вытекающая из нее оценка (5.49)) будет слишком грубой. 


Выбор значения 2 фигурирующей в выражении параметра 
ск постоянной обусловлен лишь целью выровнять коэффициен- 
ты для более простого вида связи погрешностей соседних итера- 
ционных шагов при переходе от равенства (5.43) к равенству 
(5.44) и, соответственно, оценок (5.47), (5.49). Вместо числа 2 
можно ввести априори любое другое действительное число; бу- 
дем считать его параметром ъ. Смысл его в том, что это фикси- 
руемое значение должно приниматься выражением 
а-Г'@к)(с-хь) (см. (5.41)), т.е. в случае подвижного полюса 
должно быть 


ак — Л'(хк (сь -хь) =. (5.51) 
Отсюда имеем 
р Яр -у 
Сс, =х г 
ме 


или, в соответствии с изменением другой координаты подвижно- 
го полюса Р, (ср; 4х), 


ЯЧх 70). Ск = и 


Подставив (5.52) и (5.51) в равенство (5.41), с учетом (5.42) по- 
лучаем равенство 


(5.52) 


РЕ: Л"@ь) , (ее 
$ —хь1 = р. 2 


(6-х), (5.53) 


из которого видно, что для ускорения сходимости при задании 
координат подвижного полюса по формулам (5.52) знак парамет- 
ра у(=0) желательно брать противоположным знаку второй 
производной данной функции (к сожалению, это не улучшит вы- 
текающую из (5.53) оценку 


ув + 29? 
2уа 


Ех). 


Ех 5 
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Равенство (5.53) также показывает, что при правильном согласо- 
вании знаков и том или ином определенном взаимном поведении 
первой и второй производных данной функции Х(х) в окрестно- 
сти корня & должны найтись такие значения ъ, при которых од- 
нопараметрический метод (5.45), (5.52) покажет заведомо более 
высокую скорость сходимости, чем метод Ньютона (5.14) (кста- 
ти, отметим, что характеризующее быстроту сходимости ньюто- 
новского процесса равенство (5.17) получается из (5.53) при 
у>0)Д. 

Итак, одна из версий полюсного метода Ньютона состоит в 
следующем (назовем это однопараметрическим полюсным 
методом Ньютона). 

Предположим, что функция Г(х) в уравнении (5.1) дважды 
дифференцируема и в окрестности искомого корня, содержа- 
щей начальное приближение ху, первая и вторая производные 


сохраняют знак. Возьмем некоторую постоянную т (= 0) такую, 
чтобы 


УД" (хо) < 0 
(если нет определенных соображений по ее выбору, полагаем 
у=-251еп /"(хо)). (5.54) 
При К=0,1,2,й вычисляем 
Ак -аь) 
Ар = Лк), хр = (5.55) 
А А К-1 К у (хь) 


пока не выполнится какой-либо критерий окончания итерацион- 
ного процесса (например, пока не окажется |4у| меньше задан- 
ного малого числа в > 0). 

Эффект, который можно получить, применяя полюсный ме- 
тод Ньютона (5.55) вместо классического метода Ньютона (5.14), 
продемонстрируем на следующем простом примере. 


Пример 5.5. Начиная с хо а, будем вычислять приближения к 
е 


корню & =1 уравнения шх=0 методом Ньютона (5.14) и по формулам 


(5.55), в которых в соответствии с (5.54) зафиксируем у=2. Результаты 
этих вычислений, а именно, сами приближения хх и их невязки /(хх) на 


каждой итерации А представлены табл. 5.1. 
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Таблица 5.1 


Сравнительное поведение приближений к корню & =1 


уравнения шх = 0, получаемых классическим 
и однопараметрическим полюсным методами Ньютона 


Полюсный метод Ньютона 
5.55) 


Наблюдаемая в табл. 5.1. скорость «размножения нулей» перед пер- 
вой значащей цифрой невязки в методе (5.55) подтверждает высказанные 
выше соображения в пользу возможной сверхквадратичной сходимости 
метода Ньютона с подвижным полюсом. Геометрическая иллюстрация 
первых двух шагов метода (5.55), соответствующих приведенным в табл. 
5.1 числовым результатам, показана на рис. 5.14. 


Рис. 5.14. Два шага метода (5.55) при у=2 
(5х1 — первое ньютоновское приближение, хо не различимо с &) 
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Практически такое же поведение процесса (5.55) имеет место и в 
случае выбора более «плохой» начальной точки, хо =е (для которой ус- 
ловие Фурье (5.21) не выполняется). При том же значении параметра у=2 
по формулам (5.55) находим 


х| = 0.99361162491, Го) =-0.00640886808, 
хо = 0.99999312529, (хо) =-0.00000687474 , 
хз = 0.99999999999, Л (хз) =-0.00000000001, 


т.е. с высокой точностью имеем хз = &, вто время как по методу Ньютона 
на первом шаге получается приближение х| =е т =0, 
е 


функция шх не определена, и процесс вычислений сразу застопоривается. 


в котором 


Не следует думать, что существенный выигрыш полюсной 
модификации метода Ньютона обнаруживается лишь на функци- 
ях, близких по поведению к семейству (5.50) (к которому, кста- 
ти, принадлежит использованная в примере 5.5 функция 
у = Шх). Примеров, в которых есть смысл применить полюсный 
метод Ньютона вместо классического, великое множество (см. 
хотя бы упр. 5.8). Однако имеются примеры и противоположного 
толка. Так, в случае линейной функции у=х обычный метод 
Ньютона даст точное решение за один шаг при любом начальном 
приближении хо, чего не добиться никакими ухищрениями, 


применяя нетривиальный полюсный метод Ньютона (т.е. когда 
параметр А в нем отличен от нуля). Отсюда — целесообразность 
в построении гибридного алгоритма, которому дадим название 
полюсно-бесполюсный метод Ньютона. Его организация мо- 
жет быть, например, следующей. 


Шаг 0. Задать начальное приближение хо, способ выбора 
полюсов Р» (су; Ах), критерий окончания. Положить 


к =0 
Шаг 1. Вычислить Х{+1 = Хр а 
Хр+1 = ХЕ А 
РР м 
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Шаг2. Сравнитьзнаки (Ху) и (Ху); 
если О) АО) < 0, то положить 


ча = обе +Х1) и перейти к шагу 5. 


Шаг3. Сравнить значения /(ху.1) и Х(р); если 
[оО то положить ху := Хр и пе- 
рейти к шагу 5. 

Шаг 4. Положить ху+1 = ХА. 


Шаг 5. Сделать проверку на точность; если критерий окон- 
чания не выполняется, положить А:=А+1 и вер- 
нуться к шагу 1; иначе остановить работу алгоритма, 
считая & := хр +1. 


Теперь обратимся к полюсному методу секущих (5.37). 
Сначала рассмотрим пример, демонстрирующий поведение этого 
метода. 


Пример 5.6. Для нахождения нуля той же функции /(х) = шх, что 


и в предыдущем примере 5.5, применим полюсный метод секущих (5.37), 
зафиксировав в нем абсциссу полюса с=-2 и, изменяя ординату 4 на 
каждой итерации А по правилу 4 := ах := (ху), т.е. проводя вычисле- 
ния по формулам 


Л(хк) 
ах = У ХЕ = ХЕ ЕЕ — У (5.56) 
Х-1 — ХЕ Тя 


при К=1,2,й . Беря начальное приближение хо ыА (то же, что и в при- 
е 


мере 5.5) и начальный сдвиг й = 10-4 (иначе, требующуюся для двухша- 
гового метода вторую начальную точку х| =хо + 10“), получим резуль- 
таты, показанные в табл. 5.2. Здесь же отражен и другой случай, когда бе- 
рутся начальные приближения хо =е, х! =х0 =", приводящие к рас- 
ходимости классического метода секущих (5.32). 

Как видим, полюсный метод секущих оказывается более выигрыш- 
ным по отношению к базовому для него классическому методу секущих и 


сравним по требуемому количеству значений функций (горнеров) с про- 
демонстрированным выше полюсным методом Ньютона. 
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Таблица 5.2 


Сравнительное поведение классического (5.32) и полюсного 
(в модификации (5.56)) методов секущих 


Классический метод з 
Полюсный метод секущих вида (5.56) 


9 1 ые Случай хо =е, 
случай хо =—-, х| =хо +10 ы 
у о е’ 1 0 хм = хо —10 * 


0.367979441 | —0.999728209 | 0.367979441 | —0.999728209 2.718181828 | 0.999963211 


розн ок оны [отно 

О Е У 
пене ново орет [нк 
Гео он РИ = 
С О ОО ООО ОО 


Определимся с тем, как нужно задавать координаты полюса 


Р(с; 4) в полюсном методе секущих (5.37), чтобы можно было 
рассчитывать на его сходимость, причем более быструю, чем у 
основного метода секущих (5.32). 

Будем исходить из геометрических соображений в предпо- 
ложении, что, во-первых, вторая начальная точка, т.е. х|, лежит 
между точкой хо и корнем & уравнения Г(х) = 0, а во-вторых, 
функция /(х) имеет определенное поведение в смысле направ- 
ления возрастания и выпуклости. 

Рассмотрим случай, изображенный на рис. 5.15, когда 


ж < <&, /(х)>0, /"© <0. 
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РЕ = /(х) 
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Рис. 5.15. Зоны, пригодные для выбора полюса Р(с; 4) 
в полюсном методе секущих (5.37) 


Проведем через точку (х1; 0) прямую 


Лео) Леа) ( 


0-м 


#4): 


параллельную соответствующей приближениям хо, х секущей 
АВ. Очевидно, что эта прямая и прямая х=х| разбивают всю 
координатную плоскость на две части такие, что в одной из них 
(не заштрихована) полюс Р брать заведомо бессмысленно, так 
как формула (5.37) будет приводить к точке хо, отстоящей от & 
дальше, чем х|. Из двух заштрихованных центральносимметрич- 
ных относительно точки (х1; 0) допустимых для выбора Р об- 
ластей ограничимся лишь одной, расположенной левее прямой 
х = х1. Отбросим теперь область, состоящую из точек (х; у) та- 
ких, в которых одновременно х < х|, у> 0, поскольку выбор по- 
люса Р в этой области не даст выигрыша методу (5.37) по срав- 
нению с классическим методом секущих (5.32) (на рис. 5.15 шагу 


по формуле секущих отвечает точка х>). 
Таким образом, приходим к тому, что в рассматриваемом 


случае полюс Р(с; 4) в полюсном методе секущих целесообраз- 
но выбирать в области, выделенной на рис. 5.15. двойной штри- 
ховкой, т.е. параметры с и 4 должны удовлетворять неравенствам 


Ле) 69), 


с<х, 
хо 
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-х)<4<0. (5.57) 


При этом можно с жестко зафиксировать, а 4 изменять в такт с 
получаемыми значениями функции (как это сделано в примере 
5.6, где поведение функции и начальных приближений соответ- 
ствует изученному случаю), а можно изменять и ту и другую ко- 
ординаты полюса, например, подобно тому, как это делалось в 
полюсном методе Ньютона. 

Аналогично рассматриваются и другие случаи взаимного 


поведения функции Х(х) и начальных приближений хо, х| 


(читателю предлагается проделать это самостоятельно и выпи- 
сать для каждого случая неравенства типа (5.57)). 


УПРАЖНЕНИЯ 


5.1. Докажите существование и единственность корня уравнения 


(х-1)е*-7=0. 


5.2. Найдите промежуток локализации (единичной длины) отрица- 
тельного корня уравнения х?—х? +4=0. За сколько шагов метода поло- 
винного деления можно уточнить корень до 0.1? до 0.01? до 10-6? 


5.3. С точностью до 0.01 решите уравнение /|х-4|-х+1=0: 
а) методом половинного деления; 6) методом хорд. 


5.4. С точностью до 0.001 найдите положительный корень уравнения 
х*—-2х-4=0: 


а) методом Ньютона; 6) методом секущих. 
Уточните корень, применив к результату 6) два шага метода Стеф- 
фенсена. 


5.5. Подготовьте алгоритм вычисления значения функции У=х в 


точке х=100 с точностью ==10-6, пользуясь правилом Ньютона ($ 5.5). 
Сделайте два приближения. 


5.6. На основе метода Ньютона запишите итерационный процесс, 


ы 1 
которыи позволял бы вычислять значения т при заданных веществен- 
а 


ных значениях а, не производя делений. 


5.7. Составьте гибридный алгоритм «секущих-половинного деле- 


ния». Изучите его поведение на уравнении х* +<—2? —8=0, строя при- 
ближения к положительному корню из разных пар начальных точек 
Хо, 1. 
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5.8. По аналогии с примерами 5.5, 5.6 ($ 5.7) проанализируйте срав- 
нительное поведение приближений к корню уравнения /(х)=0, начинае- 
мых со значения хо =2 и продолжаемых методами Ньютона, секущих и 
полюсными методами Ньютона и секущих с подвижными полюсами, для 


функций: а) Г(х)=е* -1, 6) Г(х) = агс® х. 


5.9. Примените гибридный алгоритм «полюсно-бесполюсный метод 
Ньютона» для нахождения корня уравнения 


хшх-х-6=0 
с точностью = =10-©. 
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ГЛАВА 6||СКАЛЯРНАЯ ЗАДАЧА 
О НЕПОДВИЖНОЙ ТОЧКЕ. 
АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ 


Задача отыскания корня нелинейного скалярного уравне- 
ния, изучавшаяся в предыдущей главе, преобразуется к эквива- 
лентной задаче о нахождении неподвижной точки некоторого 
нелинейного отображения в одномерном пространстве. К по- 
следней применяется метод простых итераций (МПИ), изуча- 
ются условия и характер его сходимости. Далее рассматрива- 
ются два способа ускорения сходимости МПИ, а именно, хоро- 


шо известный А? -процесс Эйткена и менее известный, но, как 
убедительно доказывают приводимые здесь примеры, более эф- 
фективный метод Вегстейна. На логистическом уравнении (с 
параметром) исследуется возможное поведение генерируемых 
МПИ последовательностей в случае нарушения одного из дос- 
таточных условий сходимости, дается представление о бифур- 
кациях решений и циклов. Обсуждается специфика алгебраиче- 
ских уравнений и обозначаются некоторые методы их решения 
(в частности, рассматривается метод Бернулли, идейно близ- 
кий изучавшемуся в гл. 4 степенному методу решения частичной 
алгебраической проблемы собственных значений). 


6.1. ЗАДАЧА О НЕПОДВИЖНОЙ ТОЧКЕ. 
МЕТОД ПРОСТЫХ ИТЕРАЦИЙ 


Нельзя не заметить, что все расчетные формулы, опреде- 
ляющие уже изученные методы решения скалярных уравнений 
вида Г(х)=0, т.е. (5.1), такие как метод Ньютона (5.14) и его 
модификации (5.25), (5.27), (5.29), (5.31), (5.36), имеют вид 


хр =Ф(хь), Е=0,1,2,В , (6.1) 


где Ф(х) — некоторая функция, для каждого метода своя, так 
или иначе связанная с исходной функцией ГХ(х). Попытаемся 
понять, каким требованиям должна удовлетворять функция ф(х), 
чтобы последовательность (х„), определяемая этим самым об- 
щим одношаговым итерационным способом (6.1), называемым 
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.* < 
методом простых итераций ), была сходящейся, и как постро- 
ить функцию ф(х) по функции Х(х), чтобы эта последователь- 
ность сходилась к корню данного уравнения Г(х)=0. 


Сразу отметим, что функцию 9(х) будем считать непре- 
рывной в исследуемой области оси Ох. Поэтому, если опреде- 
ляемая формулой (6.1) последовательность (х„) окажется схо- 
дящейся к некоторому числу &, то, переходя к пределу в равен- 
стве (6.1), получаем 


&=$(“), (6.2) 
т.е. $ = ип хх — корень уравнения 
К—>о 


Решение уравнений именно вида (6.3), представляет само- 
стоятельный интерес; нахождение их корней называется задачей 
о неподвижной точке. Это название связано с тем, что точка & 
при отображении с помощью ф из В, в Е, остается на месте (ра- 
зумеется, если таковая существует). 

Существование и единственность корня уравнения (6.3) ос- 
новывается на принципе сжимающих отображений или, ина- 
че, принципе неподвижной точки. 


Определение 6.1. Непрерывная функция Ф(х) называ- 
ется сжимающей (функцией сжатия) на отрезке [а, В], 
если: 


1) 9(х)Е[а, В] Ухе[а, Ь]; 
2) З4 в (0,1): [(х›)-Ф(м1 |< а[х2 —хи| Ум, хо в [а, 6]. 


Графическое толкование применения сжимающего отобра- 
жения ф (как функции множества) к промежутку сжатия [а, Б] 
предоставляет рис. 6.1. 


* 
) Другие названия: метод итераций, метод последовательных 
приближений. Далее, как и в гл. 3, будем также использовать аббревиа- 
туру МПИ. 
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Рис. 6.1. Сжатие отрезка [а, В] возрастающей функцией ф(х) 


Как видно из этого рисунка, если [а,Ь] рассматривать как 
область определения функции сжатия ф(х), то соответствующая 
ей область значений [Ф(а), Ф(Ь)| на оси ординат (отрезок [с, 4]), 
будучи перенесенным на ось абсцисс (отрезок [а1, 51|), целиком 
содержится в [а, 6]. Применяя к [а1, В | те же рассуждения, что и 
к [а, Ь], получим [а>, 55 |< [а1, В], ит.д. В итоге образуется бес- 
конечная последовательность вложенных отрезков 


[а, Ь]5[а, ы]5[а, > ]5й >[ак, Вы ]5й , 
причем их длины убывают по закону 
Ь —ах <4“(-а) > 0. 
Ко 


Следовательно, в условиях сжатия эта последователь- 
ность имеет единственную общую точку (&), которая переходит 
сама в себя, т.е. является неподвижной точкой отображения ф. 
При этом, очевидно, последовательность (а/ ) левых концов этих 
промежутков монотонно сходится к & слева, а последователь- 
ность (Б,) правых концов — справа. Так как при условии воз- 
растания ф(х), как это показано на рис.6.1, в этом процессе 


а] = Ф(а), а = (а! | аз = (а ), й й 
Ы =Ф(Ь), > =Ф(Ы), В =9(Ъ>), В, 
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то можно утверждать, что МПИ (6.1) будет давать монотонно 
сходящуюся к & последовательность, если ее начинать с ху =а 
или с хо =. Так же монотонно возрастающая и монотонно убы- 
вающая последовательности приближений будут получаться по 
формуле (6.1) и в случаях, когда за хо будет браться любая точка 
из промежутков [а,2) и (2,Ь] соответственно. 


4-5 


а а ё ЫБ х 
Рис. 6.2. Сжатие отрезка [а, |] убывающей функцией Ф(х) 


При условии убывания сжимающей функции ф(х), т.е. в 
случае, изображенном на рис. 6.2, начинающиеся с концов а и 
промежутка сжатия последовательности выстраиваются сле- 
дующим образом: 


а, ы=Ф(а), а› =Ф(Ы), В =9(а2), В, 
Ь, а =Ф(Ь), > =9(а!), аз=Ф(>), й. 


Каждая из них сходится к неподвижной точке &, и элементы ка- 
ждой из этих последовательностей с удалением от начала дают 
все более хорошие приближения то с недостатком, то с избыт- 
ком. Такую сходимость к & имеет и любая другая последова- 
тельность (х’), получаемая по формуле (6.1) при любом 
хо Е [а, 6]. Отсюда другой термин, применяемый к неподвижной 
точке &, — иентр итерации [140]. 

Более удобно иллюстрировать геометрически поведение 
итерационной последовательности (х’„), определяемой МПИ 
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(6.1), не отмечая значения ф(хх ) на оси ординат, а отражая их на 
ось абсцисс с помощью биссектрисы координатного угла у=х. 
Такие иллюстрации для случаев монотонного возрастания (ло- 
маная типа «ступеньки») и монотонного убывания (ломаная типа 
«спираль») сжимающей функции ф(х) показаны на рис. 6.3 и 6.4 
соответственно (обоснуйте!). 


фен 


в р------ 
< 
> 
фи --=-=-- 
< 
[2 
= 
> 
= 


6 о м м Хх 
Рис. 6.3. Монотонные Рис. 6.4. Двусторонние 
приближения к корню приближения к корню 


. Итогом проведенных выше рассуждений является следую- 
щий вывод: 
если на некотором промежутке [а,Ь] функция Ф(х) удов- 
летворяет условиям сжатия, зафиксированным определе- 
нием 6.1, то: Т) уравнение (6.3) имеет и притом единствен- 
ный корень &Е[а, В]; 2) к этому корню со скоростью гео- 
метрической прогрессии сходится определяемая МПИ (6.1) 
последовательность (х,), начинающаяся с любого 


хо Е[а,Б], причем скорость сходимости тем выше, чем 


* 

меньше коэффициент сжатия ) 4Е(0,1) ; 3) если функ- 
ция Ф(х) монотонно возрастает на [а, 6], то приближения 
хх к & также будут монотонными, если же ф(х) убыва- 


ет, то процесс (6.1Г) порождает двусторонние приближе- 
ния к корню &. 


* 

) Иначе, константа Липшица, в соответствии с применяемым к 
неравенству |ф(х›)- Ф(х! ]<ах› -х!| термином условие Липшица (или 
Коши-—Липшица, если заведомо 4Е(0,1)). 
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Этот вывод имеет, в основном, качественный характер. 
Дальнейшие исследования будут направлены на выявление кон- 
структивных требований к Ф(х), обеспечивающих для нее вы- 
полнение условий сжатия, и получение оценок близости генери- 
руемых МПИ (6.1) приближений хх к неподвижной точке &. 


Теорема 6.1. Пусть функция Ф(х) определена и диф- 
ференцируема на отрезке [а, 6]. Тогда, если выполняются 
условия: 

1) о(х)Е[а, В] Ухе]а, В], 

2) 34: @'(х)]<4<1 Ухе(а,Ь), 
то уравнение (6.3) имеет и притом единственный на [а, Ь] 
корень &; к этому корню сходится определяемая методом 
простых итераций (6.1) последовательность (ху), начи- 
нающаяся с любого хо Е [а, В]; при этом справедливы оцен- 
ки погрешности (УЕ Е М): 


Ч хи, (6.4) 


А 
ты —хо|. (6.5) 


Доказательство. Взяв произвольное хо из [а, 6], со- 
гласно первому требованию к 4(х), заключаем, что значение 
х =9(хо) также принадлежит [а, 6]. По индукции можно ут- 
верждать, что все члены последовательности (хх ), генерируемой 
МПИ (6.1), благодаря условию 1) не могут покинуть отре- 
зок [а, 6]. 

Вычтем из равенства (6.1) такое же равенство 

хр =Ф(хр-1) 
и к правой части полученного равенства 


хкы хх =Ф(хк )- Ф(хьт) 


применим формулу Лагранжа, согласно которой на интервале, 
определяемом точками х/_1 их; (а значит, на интервале (а, Ь)), 


найдется точка 9 такая, что 


ФС) Фи) = Ф'(у (хь фхьл). 
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Следовательно, 
Хр+1 ХЕ =Ф'(@, (ху фхь) 
и, в силу условия 2), справедливо неравенство 
Р-р 25|, (6.6) 


которое можно расценивать как выполнение главного условия 
сжатия на элементах итерационной последовательности (х’) с 
коэффициентом сжатия 4. С другой стороны, неравенство (6.6) 
указывает на факт и скорость сближения членов этой последова- 
тельности. 

Для разностей соседних более удаленных от начала членов 
последовательности (х) ) на основе (6.6) получаем: 


2 . 

[р — Хи Зак хак хи; 

3 . . 

[Хз Хы 34+ —фХьн| 34“ -Хь|; 
(6.7) 

Г : 
[ен хин 54 КЕ -хь-| УЕ №, КЕМ. 

Используя эти неравенства, оценим близость между Хк+т 
(где те М) и ху, вычитая и прибавляя все промежуточные чле- 


НЫ Хрут 1 Хат_2,й ‚Хр И применяя свойство «модуль суммы 
не превосходит суммы модулей». Имеем: 


[рн = х;| ь [дн — Фик] + [Они — Хрнт-2] +й 


й + мы ен ЖЕ <” +а"' +й +4? ах |= 
_4-а"" 


я [хх — 21|: 


Но, в свою очередь, 
ке а и -х0|, (6.8) 


что можно установить либо итерируя неравенство (6.6) при 
К=1,2,й , либо непосредственно из (6.7), полагая А =1, а затем 
1=А-1. Подставляя (6.8) в полученную выше оценку 


ет — К ей а”) - хи, (6.9) 


249 


имеем 
А 
Кыи 24 ей а. (6.10) 


Поскольку правая часть неравенства (6.10) при фиксиро- 
ванном тЕМ и А-›< стремится к нулю, (х„) — последова- 
тельность Коши и, в силу замкнутости отрезка, имеет предел 
2 Е[а,6]. Так как дифференцируемая функция непрерывна, то 
этот предел — корень уравнения (6.3). Его единственность на 
[а,Ь] доказывается от противного: предположив, что наряду с & 
есть другой корень ге [а,Б], т.е. имеет место равенство т = Ф(т), 
а значит, &-т=0(&)- (т), по формуле Лагранжа получаем 


30 е(а,Б): 5-т=9'(0)(5-т); 
последнее же равенство возможно лишь при & =т, поскольку по 
условию производная не может быть равна единице. 
Перейдя к пределу в неравенствах (6.9) и (6.10) при т-— 5, 
получаем оценки (6.4) и (6.5) соответственно, что и завершает 
доказательство теоремы. 


Анализируя условия и доказательство теоремы 6.1, нельзя 
не заметить, что основным требованием к функции $(х), обес- 
печивающим сходимость МПИ (6.1) с оценками (6.4), (6.5), явля- 
ется условие малости модуля производной. Требование же 
Ф(х) = [а,Ь] нужно лишь постольку, поскольку оно должно обес- 
печить попадание значений ф(х) на промежуток, где выполня- 
ются другие требования. Очевидно, что достаточно его выполне- 
ния только на элементах итерационной последовательности (х/ ), 
и практически это может проверяться непосредственно в процес- 
се счета по формуле (6.1). Теоретически же, когда [а,Б] — не вся 
числовая ось (тогда надобности в этом условии нет), имеется не- 
сколько возможностей заменить требование ф(х)=[а,Ь] более 
конструктивным, т.е. априори проверяемым условием. 

Будем исходить из того, что имеется некоторая точка хо, 
которую можно взять в качестве начального приближения и в 
окрестности которой функция Ф(х) дифференцируема и имеет 
малую по модулю производную. Тогда существование и единст- 
венность корня & уравнения (6.3) и сходимость к нему начатого 
с хо процесса (6.1) можно связать с величиной г радиуса этой 
окрестности точки хо. 
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Теорема 6.2. Пусть на отрезке [ху —г, хо +"| функция 
Ф(х) определена, дифференцируема и ее производная удов- 
летворяет неравенству 


|Ф'(х)]<4<1. (6.11) 
Тогда, если величина г такова, что 
[хо (хо < "@-а), (6.12) 


то на [хо -—г, хо +г| имеется единственный корень & урав- 
нения (6.3), и к нему сходится начатый с хо метод про- 
стых итераций (6.1) с оценками погрешности (6.4), (6.5). 


Доказательство. Так как 1-4 <1, то, в силу неравен- 
ства (6.12), хм =9(хо)Е[хо-г, хо+"]. Предположив, что 
х, =Ф(х, 1) принадлежит г-окрестности точки хо при некото- 
ром КЕМ, покажем, что там же будет и ху. =Ф(хь). Действи- 
тельно, поскольку, согласно предположению, на отрезке 
[хо-хк, хо +хк |< [хо —", хо+/] функция 9(х) определена и 
дифференцируема, на этом отрезке найдется точка /4, такая, что 


хи хо = (к )-9(хо)+Ф (хо )- хо = 
=Ф'(ик (хь —-х0)+9(х0 )- хо. 
Отсюда, переходя к модулям, получаем неравенство 
|1 =х0[<4"+"(-4)=*, 


означающее, что ху+1 Е [хо —^, хо +]. 

Таким образом, на элементах итерационной последователь- 
ности (хх) выполняется первое требование теоремы 6.1 для от- 
резка [а, 6] са:=ху-г, Ь:= хо +, и вместе с требованием (6.11) 
оно обеспечивает справедливость заключения теоремы. 


Полученные для МПИ простые оценки погрешности (6.4) и 
(6.5) можно использовать в практических вычислениях как для 
завершения итерационного процесса (6.1) по правилу: 


4 = @=аЕ8), (6.13) 


так и для предварительной прикидки числа итераций, достаточ- 
ного для получения корня с заданной точностью =: 


1а- х0|<=5 > &>— т 20-9) _ 
1 па [№ -9(00) 
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ш=-1 
(или К > рыли. ВЫ" условиях теоремы 6.2). 


Замечание 6.1. Легко видеть, что часто применяемый на практике 
простой критерий окончания процесса итераций (6.1) по выполнении не- 
равенства |х; -х,1|<= обоснован в двух случаях: когда -1<9'(хь)<0, 
т.е. МПИ дает двусторонние приближения (корень & всегда «зажат» меж- 
ду любыми двумя соседними приближениями, расстояние между которы- 
ми служит эффективной оценкой погрешности, см. рис. 6.4), и когда 


1 1- 
0<ф’(хк)<а<1, но при этом = (тогда А, и фигурирующее в 


Ч 
(6.13) неравенство будет заведомо выполнено). Использование этого уп- 
рощенного критерия окончания при значениях 4, близких к концам ин- 


тервала (0, 1) чревато либо лишними итерациями, либо недоитерированием. 


Обратимся к связи между уравнением Г(х)=0 (5.1) и зада- 
чей о неподвижной точке — уравнением (6.3). Переписав (6.3) в 
виде 


х-9(х)=0, (6.14) 


можно сказать, что это есть уравнение (5.1) с Х(х):=х-ф(х), и 
применять к (6.14) все рассмотренные в предыдущих параграфах 
рассуждения и методы. Приведение уравнения (5.1) к виду (6.3) 
можно осуществлять множеством способов, но при этом всегда 
следует помнить, что это приведение нужно выполнять так, что- 
бы полученное уравнение соответствующего вида было не толь- 
ко эквивалентным (5.1), но и пригодным для проведения итера- 
ций, т.е. удовлетворяло оговоренным в теоремах 6.1, 6.2 услови- 
ям. Кроме того, попутно могут учитываться такие требования к 
получающемуся при этом методу итераций, как простота расчет- 
ной формулы, быстрота сходимости (малость 4), характер схо- 
димости (монотонность или двусторонность приближений). Если 
уравнение (5.1) имеет несколько корней, то для нахождения каж- 
дого из них формируется своя задача о неподвижной точке. 
Иногда преобразование уравнения (5.1) к виду (6.3) не вы- 
зывает больших затруднений и выполняется непосредственно. 


Например, уравнение 
4-2х-зтх=0 
достаточно записать в виде 
х=2- 0.5зшх, 
чтобы сказать, что оно имеет и притом единственное в ® решение, к ко- 
торому сходится при любом х, е В последовательность 


хьн =2- 0.5 31 хх 
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со скоростью геометрической прогрессии со знаменателем 4 < 0.5, по- 
скольку функция Ф(х)=2- 0.55тх имеет производную ф’(х) = -0.5 созх, 
абсолютная величина которой не превосходит 0.5 при любых хЕ В. 


В общем случае переход от (5.1) к (6.3) осуществляют так: 
умножают левую и правую части уравнения (5.1) на отличный от 
нуля параметр -4 и к обеим частям прибавляют по х; в ре- 
зультате получается равносильное (5.1) уравнение 


х=х- д (х), (6.15) 
которое имеет вид (6.3) с Ф(х):=х-ЯХ(х). Далее параметр А 
подбирается таким, чтобы производная ф'(х)=1-Я/’(х) в нуж- 
ной области была малой по модулю (а если надо, то чтобы еще 
имела определенный знак). 

Конкретные рекомендации по фиксированию А в (6.15) мо- 
гут быть даны в случае, когда, например, известны оценки свер- 
ху и снизу для производной исходной функции Х(х). А именно, 
пусть 

0<а< Г'(х)<у<о 
(если производная /’(х) отрицательна, можно заменить уравне- 
ние /(х)=0 на уравнение - Х(х)=0, т.е. работать с функцией 
— 1 (>)). Тогда, соответственно, 


1-17<9'(х)<1-йа, (6.16) 
и значит, 
|@'(х) < (4) = тах! — #4, | - #7}. 
Анализируя двойное неравенство (6.16), можно увидеть, что при 


любых ле [0,2 будет 4(1)<1. В частности, при ДЕ имеет 
›й 


Х 
место неравенство 


0<6'(х)<1-@ <1, 
у 


обеспечивающее монотонную сходимость соответствующего 
МПИ со скоростью, определяемой оценками (6.4), (6.5) при 


4 =1-@. Оптимальным же значением А является #=40 А 
Х а+у 
При этом значении А границы неравенства (6.16) таковы: 
Де. 1-Я 
а+у а-+у 
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т.е. максимум |ф'(х}]|, равный а()=7—%, достигается на каж- 
а+ 


дом из элементов двухэлементного множества {||1- да, 1-77}. 


В отсутствие нужных оценок для {’(х) можно предложить 
следующие рассуждения. Если известно, что искомый корень 
находится в окрестности заданной точки хо, где производная 
меняется не очень быстро, возьмем ЛД таким, чтобы ф’(хо)=0. 
Тогда по непрерывности производная должна остаться малой в 
окрестности хо, т.е. можно рассчитывать на сходимость полу- 
чающегося при этом итерационного процесса. Имеем: 


| 


1-/'(х0)=0 => = 


Го). 

Подставляя это А в (6.15), получаем уравнение вида (6.3) 

%=х 28. 5 

Ло) 
и соответствующий ему МПИ (6.1) определяется формулой 
Лок) 
ХК 1 2 = ' › 
у Ло) 


в которой узнаём модифицированный метод Ньютона’) (2:27) 


6.2. УСКОРЕНИЕ СХОДИМОСТИ 
ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ 


Как явствует из предыдущего параграфа, МПИ (6.1) имеет 
лишь линейную сходимость, причем в случаях, когда производ- 
ная функции Ф(х) близка к единице, эта сходимость может быть 
весьма медленной. 

Один путь ускорения сходимости МПИ — построение 


“) В [138, 139] метод простых итераций, примененный к уравнению 
(6.15), т.е. процесс вида 
хр =хк -@ (хх ), 
при условии, что з1епа = $11 /"(хк), называют методом хорд (или парал- 
лельных хорд), и модифицированный метод Ньютона считают частным 
случаем этого метода. 
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нестационарных процессов на основе МПИ. На стадии приве- 
дения уравнения (5.1) к задаче о неподвижной точке (6.3) можно 
подменить (5.1) не однопараметрическим семейством уравнений 
(6.15), а последовательностью уравнений 


х=х-Я/(х), К=0,1,2,й , 
и в соответствующей таким уравнениям формуле МПИ 
О (6.17) 
параметры Я; подбирать так, чтобы при этом учитывалась ин- 
формация, получаемая на предыдущем шаге. Если, например, 
выбор параметра Л, подчинить соображениям, что 
1 
Ф'(хк)=1-Я "(к )=0, т.е. взять А, =———, то (6.17) будет 
Л'(хь) 
определять основной метод Ньютона, сходящийся, как уже из- 
вестно (см. $ 5.4), квадратично. Можно выбирать и другие стра- 
тегии фиксирования Ах, но вряд ли здесь следует ожидать нечто 
принципиально новое, что нельзя более естественно получить с 


помощью формулы Тейлора и интерполяционных формул.) 

Другой путь — это алгоритмическое построение последова- 
тельностей, так или иначе «паразитирующих» на последователь- 
ности приближений МПИ (6.1), т.е. получаемых с помощью не- 
сложных арифметических манипуляций над несколькими члена- 
ми последовательности (х„) и в результате имеющих более бы- 
струю сходимость. Для всех таких методов характерны многоша- 
говость, экономичность (поскольку более быстрая сходимость 
по сравнению с базовой последовательностью достигается без 
дополнительного вычисления значений функций), а также слож- 
ность исследования условий и скорости сходимости, отсюда — 
отсутствие эффективных априорных оценок погрешностей. 
Возможны ситуации, когда новый метод окажется сходящимся, в 
то время как базовый для него МПИ расходится. 

Рассмотрим два таких метода ускорения сходимости после- 
довательности (6.1), не делая попыток их строгого обоснования, 
а ограничиваясь рациональными рассуждениями при их выводе, 
а также наглядными примерами, демонстрирующими их эффек- 
тивность. Наличие неподвижной точки & и дифференцируе- 


мость функции ф(х) далее всюду предполагается. 


* 

) Довольно обширная и глубокая теория итерационных методов, в 
основу которой положено понятие итерационной функции, содержится в 
монографии известного американского математика Дж. Трауба [176]. 
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6.2.1. А? -ПРОЦЕСС ЭЙТКЕНА”) 


Пусть (хх) — последовательность, получаемая по формуле 
(6.1). Вычитая (6.1) из (6.2), имеем 


&-хьы =$($)-Ф(хь), 
а уменьшив здесь индекс на единицу, получаем 
&-хь =$(6)-Ф(хь 1). 


К правым частям этих равенств применим формулу Лагранжа, 
согласно которой найдутся точки ср и с; _1 такие, что 


Ф(<)-Ф(хь) = Ф'(ск 6 -хь) 
Ф(8)-Ф(хь)=Ф (с) фхь). 


Таким образом, имеют место следующие связи между ошибками 
соседних приближений: 


ху = (ск {6 -хк), б-хь =’) -хь-1). 
Предположим, что в той окрестности корня &, в которой 


находятся точки х/_ и х;, производная ф’(х) меняется не очень 
быстро. Это допущение позволяет считать, что 


Ф'(ск)= (с) = 
(где 77 — некоторое число), и значит, 
Ех ТЕ -хь), Ех ИЕ -хьз). 
Беря отношение этих приближенных равенств, избавляемся от й: 
б-Хь1 6-Х 
т 
к 6 


и разрешаем полученное приближенное уравнение относительно 
неизвестной величины &: 


(6.18) 


2 
хаха -х 
ыы = Зы ЗИ (6.19) 
Хр — 2х + ХЕ 


* 

) Метод (читается: «дельта-два-процесс») заложен в публикации 
А.АИКеп 1931 г. Первоначально был предназначен для улучшения метода 
Бернулли решения алгебраических уравнений (см. далее $ 6.4). Развитию 
той же идеи посвятил свою статью в 1933 г. 1.Е.54еНепзеп, в связи с чем, 
например, в книге [192], где изучается сходимость метода и дается его обоб- 
щение, он называется итерационный процесс Эйткена-Стеффенсена. 
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Приближенное выражение корня & по формуле (6.19) мож- 
но использовать на завершающем этапе применения метода про- 
стых итераций (6.1), чтобы получить более точное значение & с 
помощью трех последних членов последовательности (ху). В 
развитие же метода обозначим правую часть приближенного ра- 
венства (6.19) через х/.|1 и придадим его выражению другой вид: 


2 2 
> с. РЕНА _ ры -хь) 
а 

Хы АХ Хе Ак +1 
Более коротко это записывается так: 
2 
= (Ахх) 
ХЕ = Хе 5 (6.20) 
ХК 
ты 2 == = 
где Ах, :=хи-хь, А’хь:=Ахр — Ах = Хы -2хк+хь4 — 
так называемые Е первого и второго поряд- 
ков соответственно (подро нее о конечных разностях см. И В 


$ 8.4). Отсюда название (6.20) А? -преобразование или А?- 


процесс Эйткена." 
Организация вычислений на основе этого преобразования 
может быть ыы Наиболее целесообразным считается 


применение А? —ускорения (6.20) через два шага МПИ на тре- 


тий °). Поскольку в этом комбинированном методе нахождения 
корня Е. уравнения (6.3) участвует хорошо изученный МПИ (6.1), 
для останова процесса вычислений можно использовать в подхо- 
дящей его фазе вполне надежный критерий (6.13). 

Примером реализации такого метода может служить сле- 
дующий алгоритм. 


А?алгоритм Эйткена 
Шаг 0. Ввод хо (начального приближения), Ф(х) (исход- 


ной функции), 4 (оценки модуля производной), 
(допустимой абсолютной погрешности). 


* 

) Вместо (6.20) для А -преобразования Эйткена используют и дру- 
2 
(Ах) 


я (убедитесь в его эквивалентно- 
АХ 


гое представление: Ху -1 = хи - 


сти (6.20)). 


*Ж* 

) Применение А”. преобразования менее, чем через два шага 
МПИ, необоснованно, так как оно должно применяться к трем последова- 
тельным членам линейно сходящейся последовательности. 
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Шаг 1. Вычисление значений: х| := (хо), хо = Ф(х1). 


2 
= хох2 —х 
Шаг 2. А?-ускорение: х› ке Зы МИ 
х2—-2^м +х0 
Шаг3. Вычисление контрольного значения: хз := Ф(х> ). 


И ы 
Шаг 4. Проверка на точность: если [хз -%|>-—Ф=, то 
положить хо:=Х>, хр:=хз, вычислить хо :=ф(х|) и 
вернуться к шагу 2. 
Шаг 5. Положить & := хз (с точностью =). 


Шаг ускорения по методу Эйткена (6.20) на базе последова- 
тельности (ху), получаемой МПИ (6.1), имеет простую геомет- 
рическую интерпретацию (рис. 6.5 и рис. 6.6 для случаев 
—1<ф'(х)<0и0<ф’(х)<1 соответственно). Рассмотрим ее. 


0 
хх сы  Жы Х 
Рис. 6.5. Ускорение по методу Рис. 6.6. Ускорение по методу 
Эйткена (случай убывающей Эйткена (случай возрастающей 
функции Ф(х)) функции Ф(х)) 


Проведем прямую (хорду, секущую) через точки 
А(х 1; Ф(х)) и В(хь; Ф(хь)) кривой у= Ф(х). Тогда абсцисса 
точки пересечения этой прямой с прямой у=х как раз и будет 


определяемая А?-преобразованием Эйткена (6.20) точка Ху-1 оси 
Ох. 
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Действительно, в силу (6.1), координаты точек А и В 
можно записать иначе: А(ху_1; хх), В(хь; ха). Значит, урав- 


нение прямой ( АВ) имеет вид 
Ук _ 
ХА ХЕ ХЕХ 
Рассматривая его совместно с уравнением у=х, т.е. заменяя в 
нем уих на х, ‚|, получаем то же выражение 


2 
ХХ ХА 
) 
Хр — 2% + ХК 


Хр- = 


от которого пришли к (6.20). 


Такая интерпретация Д?-процесса Эйткена наталкивает на 
мысль о его возможной связи с изученным ранее методом секу- 
щих (5.32). 

Полагая /(х):=х-ф(х), применим к этой функции формулу 
(5.32), считая при этом, что требуемые в (5.32) значения элемен- 
тов последовательности (хх) получаются не по той же формуле 
(5.32), ас помощью МПИ (6.1). Имеем: 


оба) бе) _ 
@ьо-Го) ^^ жаб +90) 


2 
_ бк -хьы ка -хь) _ ххх 


= = ХА+1. 


Хр 2х + Хы 2 + 


Таким образом, один шаг А?-ускорения МПИ по методу Эйткена 
совпадает с одним шагом метода секущих, примененного к той 
же паре последних точек из последовательности МПИ. 
Сделанное наблюдение в свете известных о методе секущих 
сведений позволяет с большой осторожностью судить об эффек- 
те ускорения сходимости, который может принести использова- 
ние метода Эйткена. Надежность его, очевидно, выше в случае, 


1 
когда ф’(х)е (-1,0), применение более актуально, если 4>-—, и 


ускорение тем эффективней, чем меньше |ф”(х)] в окрестности 
корня &. 

Применяя метод Эйткена, не следует забывать о проблеме 
своевременного прерывания счета из-за потерь точности при вы- 


читании близких чисел. Подключение А?-ускорения на ранней 
стадии МПИ, когда хо далеко от &, может привести к расходи- 


мости процесса, по крайней мере, в случае, когда ф’(х)>0 
(представьте эту ситуацию, рассматривая рис. 6.6). В то же вре- 
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мя, иногда с помощью метода Эйткена можно получить сходи- 
мость в условиях, когда МПИ (6.1) расходится (см., например, 


рис. 6.7, где [2 —хк|> Е -хь1|, но Е-ху |< -хх|). 


1 
1 
1 
1 
1 
1 
1 
1 
1 
+ 
1 
1 
1 
1 
О 
1 
т 


ХА Хе ЖА Хх 


Рис. 6.7. Демонстрация возможной сходимости последовательности 
Эйткена [697 ) при расходимости последовательности МПИ (хх) 


Замечание 6.2. А? -преобразование Эйткена применимо не только к 
последовательности приближений (6.1), но и к любым другим последова- 
тельностям, сходящимся со скоростью геометрической прогрессии. Дей- 
ствительно, пусть (хх) — некоторая последовательность, линейно сходя- 


щаяся к предельной точке &. Тогда можно считать, что разность &—хх 


изменяется по закону геометрической прогрессии, т.е. существуют такие 
постоянная ие (0,1) и слабо изменяющаяся варианта Су = С, что 


К- К +1 
-х1я Си , 6-х =Си , Е-жыя Су“. 
Отсюда получаем приближенные равенства 
—х = 
ХА ие у 
ХК е-Х 


следствием которых является равенство (6.18), в итоге приводящее к фор- 


) 


муле (6.20). Такой подход к выводу А? -метода Эйткена позволяет исполь- 
зовать его при решении других задач (см., например, замечание 4.6). 


Применение 42 -преобразования Эйткена к последовательно- 
стям, сходящимся квадратично, эффекта ускорения не дает [176]. 
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6.2.2. МЕТОД ВЕГСТЕЙ НА”) 


При выводе метода Вегстейна решения задачи о непод- 
вижной точке (6.3) будем использовать как аналитические, так и 
геометрические соображения. 


Пусть уже найдены: х — элемент строящейся здесь после- 
довательности, и х/.1 =Ф(х») — точка, соответствующая одно- 
му шагу МПИ, примененного к точке х„. Независимо от того, 
сходится начатый с х‚ МПИ (рис. 6.8, где Е —ху|<Е-хХ|) или 
расходится (рис. 6.9 с Е-х/.1|>[-х,|), отрезок АВ, парал- 
лельный оси Ох и имеющий концами точки А(ху; Ф(хь)) и 
В(хь-1; Хы), можно разделить точкой С’ так, чтобы она при- 
надлежала вертикальной прямой х=ё (при этом во втором слу- 
чае речь идет о делении отрезка внешним образом). 


хи 6 № м 5 ЖЖ  Жы Хх 
Рис. 6.8. К построению метода Рис. 6.9. К построению метода 
Вегстейна (случай сходящегося МПИ) Вегстейна (случай, когда МПИ 
расходится 


При любых комбинациях направлений возрастания и вы- 
пуклости графика функции у = 0(х) в окрестности неподвижной 
точки & имеет место равенство длин отрезков ВС=РС. Различа- 
ются два случая: когда ВС =&-х,.1 и когда ВС =х,.1-&. По 
формуле Лагранжа соответственно имеем 


РС =$(8)-Ф(х,)=ф’(@0, {6 -хь) 


*) Ссылки на первую публикацию этого метода (1958 г) имеются в 
[106, 115] (в [115] его называют усовершенствованным методом после- 
довательных приближений). К сожалению, описание метода Вегстейна 
пока не заняло достойного места в отечественной учебной литературе по 
вычислительной математике. Нет упоминания о нем и в монографии [176]. 


261 


или 
РС=ф(х, )-Ф(6)=ф'(@, (хх —5). 
В любом случае можно утверждать, что существует точка 
9, Е(х,, &) или 6, Е (&, ху ) такая, что 
б-хун =Ф'(@, {6 -хь). 
Разрешая это линейное уравнение относительно &, находим 


хи -х 
сен. (6.21) 


Ф'(бу) 

Если бы значение ф’(0,, )было известно, то тем самым зада- 
ча о неподвижной точке (6.3) была бы решена точно. Заменим 
это неизвестное значение ф’(@9, ) аппроксимирующим его разно- 
стным отношением: 

Фо) ФС) _ хе -хь. 
Я а 
Хх -Я- 1 ХЕ = - 1 


х 
ХЕХЕ в (6.21), 
Ф'(0,) хи -хь 

вместо корня & получаем приближение к нему 


Подставляя приближенное значение 


(хин -хк (хин -Хь) | 
а-я) 


Эта итерационная формула, где А=1, 2,3,Й , совместно с фор- 
мулой 


Хр = к — (6.22) 


хин! =Ф(х,) (&=0,1,2,й) (6.23) 


и начальными значениями хо = хо, х| = х| полностью определя- 
ет метод Вегстейна для задачи (6.3). 

Значение х›, получаемое по формуле Вегстейна (6.22) при 
заданных начальных значениях хо и х|, совпадает со значением 


х>, вычисляемым 42 -процессом Эйткена. Далее, т.е. при А>2, 
процессы (6. 20) и (6.22) различаются. Учитывая, что МПИ явля- 
ется составной частью метода Вегстейна, в случаях, когда 
[Ф'(х]<4<1, можно заканчивать процесс вычислений, как и в 
методе Эйткена, по выполнении критерия (6.13). 

Таким образом, для реализации метода (6.22)—(6.23) может 
быть предложен, например, следующий алгоритм. 


262 


Алгоритм Вегстейна 
Шаг 0.Ввести хо (начальное приближение), ф(х) (исход- 
ную функцию), 4 (оценку модуля производной), = 
(допустимую абсолютную погрешность). 
Шаг 1.Вычислить х| := Ф(хо) ; положить хо = х0, Х! = 21. 
Шаг 2. Вычислить хо := Ф(х| ). 
Шаг 3. Проверить на точность: если |х› -х!|> =(1-4)/4 ‚ то 


= хх - 1х1 
вычислить хо ===; переприсвоить зна- 
Хх +х0 — м- Хх 
чения хо = 1, х1 = х2, Х; => и вернуться к шагу 2. 


Шаг 4. Положить & := хо (с точностью 5). 


Разумеется, проверку на точность в подобном алгоритме 
можно устраивать иную (что просто необходимо, если метод 
Вегстейна применяется в случаях, когда |0’(х] >1). Если нет уг- 
розы большой потери точности из-за вычитания близких чисел, 
то заканчивать работу алгоритма Вегстейна лучше выводом зна- 
чения &:=х)›. Для вычисления значения х› в этом алгоритме 
применена равносильная (6.22) формула 

= о ХА ХЕХ 

Ху = — ПИ 
Хы + 1-Х ХЕ 
имеющая несколько отличную от (6.22) структуру. 

Как показывают многочисленные эксперименты с уравне- 
ниями вида х=0(х), особый интерес среди которых вызывают 
случаи, когда простые итерации дают расходящиеся последова- 
тельности (х,), метод Вегстейна имеет определенные преиму- 
щества перед методом Эйткена по количеству обращений к вы- 
числению значений ф(х) для получения корня с заданной точно- 
стью. Чаще всего, метод Вегстейна еще и позволяет в более ши- 
роких пределах варьировать выбор начальной точки хо. Резуль- 
таты сравнения этих двух методов на нескольких таких уравне- 
ниях представлены в табл. 6.1. В двух ее последних столбцах 
указано количество вычислений значений функции ф(х) (горне- 


* 

ров), потребовавшееся для достижения точки х =ё (прибли- 
КР * * = 

женного значения корня) такой, что ь -0( |<10 . (Приве- 


денные данные получены Ковалевым П.В. на ВМ РС/АТ-286). 


263 


Таблица 6.1 


Примеры применения алгоритмов Эйткена и Вегстейна к 
‘уравнениям вида х = Ф(х) 


Функция | Корень © Значение |Начальное | __ Число горнеров___ 
ф(х) (точность | производной | прибли- метод метод 
Ф'(5) (он жение хо | ЭЙТКена | Вегстейна 


— 1.521379 
Е 


расходится 


— 


Обратим внимание, что лишь для одного корня из семи в 
данной таблице можно говорить о сходимости МПИ. 


6.3. НЕЛИНЕЙНЫЕ УРАВНЕНИЯ С ПАРАМЕТРОМ. 


* 
БИФУРКАЦИИ”) 

Материал $ 6.1 можно интерпретировать так: нелинейная 
непрерывная математическая модель (6.3) некоего явления изу- 
чается путем построения и исследования соответствующей дис- 
кретной модели (6.1). Связь между этими моделями на отрезке 
[а, Ь] устанавливается при выполнении двух следующих условий: 

Ф(х)Е[а,Б] \Ухе[а,Ь] (отображение в себя) 
и (6.24) 


|Ф'(х]<1 Ухе(а,Ь) (сжатие). 


* 
) Сведения, излагаемые в этом пункте, имеют ознакомительный ха- 

рактер и опираются на статью [8]. Из других литературных источников, по- 

священных рассматриваемым здесь вопросам, отметим еще книгу [97, 193]. 
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А именно, согласно теореме 6.1, эти условия являются достаточ- 
ными для существования и единственности на [а, 5] решения & 
непрерывной задачи (6.3), причем оно может быть получено как 
предел последовательности (х„) (т.е. как решение дискретной 
задачи (6.1)), начинающейся с любой точки хо Е[а, В]. Послед- 
нее можно расценить как устойчивость в данном смысле реше- 
ния & дискретной модели (6.1). 

Продолжим изучение взаимосвязи непрерывной и дискрет- 
ной одномерных нелинейных моделей в следующем русле. 

Во-первых, возьмем за основу и будем рассматривать неко- 
торую конкретную дискретную модель, а для ее исследования 
привлечем соответствующую непрерывную модель. 

Во-вторых, попытаемся выяснить, к чему может привести 
нарушение условий сходимости МПИ, т.е. условий (6.24), при- 
менительно к данной модели, и какие «тайны» могут скрываться 
за термином нелинейность. 

Преследуя эти цели, введем в дискретное (6.1) и непрерыв- 
ное (6.3) уравнения вещественный параметр А, т.е. будем изу- 
чать связь между моделями вида 


жн=Ф(х, 4), К=0,1,2,й; же[а, В] (6.25) 


х=ф(х, А), хе[а, Ь]. (6.26) 


Заметим, что не так редки ситуации, когда в приложениях 
математики первичными являются именно дискретные модели, а 
их непрерывные аналоги нужны для того, чтобы воспользоваться 
хорошо развитой теорией математического анализа и плодами 
вычислительной математики, которая, в основном, построена по 
принципу «непрерывная задача —> дискретная аппроксимация». 

Представим себе следующую весьма идеализированную 
картину. Пусть на некоторой ограниченной территории, напри- 
мер, на острове, может прокормиться не более М животных оп- 
ределенного вида, и пусть в начальный момент наблюдений за 
ними их количество было 20 Е (0, №). Будем считать, что жи- 
вотные ежегодно приносят потомство, и скорость размножения 
характеризуется некоторым параметром © > 0. Тогда, если через 
2х обозначить численность животных в А-Й год после начала 
наблюдения, то можно предположить, что закон ежегодного из- 
менения численности популяции грубо описывается моделью 


и =а8 к (М-8ь), =О12.й Е (6.27) 


В пользу принятия такой модели говорят следующие рас- 
суждения. Если значение 20 начальной численности мало, то 
второй сомножитель в начале процесса почти постоянен, и все 
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зависит от коэффициента роста ©: при малых & ‚ т.е. при низкой 
скорости размножения, численность животных будет снижаться 
и, в конце концов, популяция гибнет. Если же &/Е[0, №] возрас- 


тает и приближается к максимально возможному значению М, 
то за счет близости к нулю второго сомножителя численность 
популяции естественно начнет снижаться. 


Чтобы облегчить исследование модели (6.27), упростим ее 
заменой переменных. Переписав (6.27) в виде 


Зы _ ма.) 
№ М № 


) 


* 
и положив хх =, Я = Ма , приходим к уравнению 


Хк-+1 = ях (1-хь), (6.28) 


где К=0,1,2,й ‚ азначения хх в соответствии со смыслом зада- 
чи должны принадлежать отрезку [0, 1]. 


На равенство (6.28) можно смотреть как на МПИ (6.25), 
применяемый к задаче о неподвижной точке вида (6.26), т.е. к 
задаче о корнях уравнения 


х=1>х(1-х) (6.29) 


в области хЕ[0, 1]. 
Условившись не использовать далее в обозначениях функ- 
ции ее явную зависимость от параметра А, положим 


ф(х) = Ях (1-х) 
и преобразуем эту квадратичную функцию к виду 


«э-1- 


Я 1 
Из последнего следует, что тах 90) = при = и что 


Ф(х) отображает отрезок [0,1] в [0.2 Значит, при А Е[0, 4] 


функция Ф(х) осуществляет на отрезке [0,1] отображение в себя, 


* 
) Это конкретное уравнение называют логистическим [193]. 
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т.е. при этих А элементы последовательности (х/), получаемой 
с помощью равенства (6.28), при любом ху [0,1] не выйдут за 
пределы [0,1], другими словами, определены при любом 
* 
&=0,1,2,й °). 
Для производной данной функции ф(х) имеем: 


ф'(х) = 1(1-2х) и шах |Ф'(х)|= 4. 
хе[0, 1] 


Следовательно, при А<1 отображение ф(х) является сжи- 
мающим на [0,1] и имеет единственную неподвижную точку 
4 Е[0, 1], а именно &, =0, которая является пределом последо- 
вательности (х)) при любом начальном значении хо Е [0, 1] (по- 


пуляция гибнет по причине недостаточной скорости воспроиз- 
водства). Геометрическая иллюстрация этого случая, соответст- 
вующего выполнению условий теоремы 6.1, показана на рис. 6.10. 


СТ +1 0.5 ХК |х ХК Хкзй 62 


Рис. 6.10. Сходимость МПИ (6.28) к Рис. 6.11. Сходимость МПИ (6.28) к 
корню &1 = 0 логистического = 
‘уравнения (6.29) при А Е(0,1) корню ©? 1 при лЕ(ЬЛ1) 


При 1<4<4 нарушается одно из условий сходимости 
МПИ: ф(х) не является функцией сжатия. Что же это влечет? 


* 
) При #>4 нарушается соответствие между дискретной (6.25) и 
а 1 Я 
непрерывной (6.26) моделями. Например, при хо =» уже х! наи т.е. не 


принадлежит множеству, на котором определена функция 4(х). 
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Очевидно, уравнение (6.29) по-прежнему сохраняет реше- 
ние &, =0=[0, 1]. Но при переходе А через 1 это решение теряет 

х Я—1 
устойчивость и появляется второе решение 25 =—— < [0, ||, ко- 


торое следует считать устойчивым, поскольку теперь именно к 
нему будет сходиться любая последовательность, определяемая 
начатым с хо Е [0, 1] МПИ (6.28) (рис. 6.11). Произошло явление, 
которое носит название бифуркация решений: вместо одного 


* 
решения на рассматриваемом промежутке стало два решения ). 


н------- 


чи $----------- 


[552 


> 
[29 а] а 1 х 


Рис. 6.12. Предельное поведение последовательности 
хи =@(хь), где Ф(х =А и) при АЕ(Л1, Л) 
Сходимость (х,) к &› будет наблюдаться не при всех 
АЕ, 4]. Оказывается, существует число Л| >1 такое, при пере- 
ходе 7 через которое начнет происходить зацикливание после- 
довательности (х; ). А именно, какое бы ни взяли хо Е (0,1), на- 


чатая с него и продолжаемая по формуле (6.28) последователь- 
ность будет обладать тем свойством, что все ее четные члены 
будут иметь пределом одно число, а нечетные — другое. Это оз- 
начает, что найдутся числа а1, а Е (0, 1) (при каждом А свои) та- 
кие, что а) =Ф(а) и а =9(а>), причем а *а*&, (1=1,2) 
(см. рис. 6.12). В этом случае говорят, что дискретное отображе- 
ние (6.28) имеет устойчивый цикл периода 2 и обозначают 


* 
) ВГигсих (лат.) — раздвоенный. Термин введен К. Якоби в 1834 
году. Теория бифуркаций заложена Анри Пуанкаре в конце Х[Х века. 
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его 52. Относя это к исходной модельной задаче с животными, 
можно сказать, что при значениях Д> Л численность популя- 
ции будет меняться периодически с периодом в два «года». 

Зная ситуацию качественно, нетрудно найти точно порого- 
вое значение Л |, при котором появляется устойчивый цикл 5. 

Действительно, если известно, что на (0,1) имеются точки 
а, а› такие, что а›=9(а), а =9(а>), то значит, 
а = Ф(Ф(а>)), а! = 9(Ф(а1 )), т.е. а1 и а› — неподвижные точки 
отображения ФО (х):= (Ф(х)), иначе, — корни уравнения 
х=Ф(Ф(х)). 

Так как эта суперпозиция сохраняет старые неподвижные 
точки &1 =0и &> =(1-1)/А, то уравнение 


х= 7 (#х(1-х))- Ях(-х)) 


должно иметь четыре корня, из которых два известны (рис. 6.13). 


Я 


а] > а 1 х 


Рис. 6.13. График функции фо (х):= Ф(Ф(х)) при Ф(Х = 2(х — х2), 
АЕ(Лу, Ло) иее неподвижные точки (1, &>, ат, а2) 


Исключив из этого уравнения известные корни, приходим к 
квадратному уравнению 


Положительное значение Й, которое служит границей об- 
ласти положительности дискриминанта р= (1? -24-3] ро 
этого уравнения, как раз и есть искомое значение Лу, начиная с 
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которого появляются новые устойчивые неподвижные точки 4], 


ар, т.е. цикл 87. Очевидно, это Л! =3. Устойчивость неподвиж- 


ных для Фо (х) точек а1,2 [вт зач в том смыс- 


ле, что они становятся точками четно-нечетного притяжения для 
последовательности (хх У устанавливается непосредственной 


проверкой условия м. ФО(х) | «1. 
АХ х=а1, 2 


Дальнейшее увеличение Д в дискретном уравнении (6.28) 
ведет к тому, что начиная с некоторого Ло, зацикливание будет 
иметь более сложный характер: при каждом ДЕ(Л›, Лз), где 
Ло >3, Лз <4, найдутся числа а], ао, аз, ад (зависящие от 4) 
такие, что а> =Ф(а1), аз =Ф(а›), ад =9(аз), а! =ф(ад), и чле- 
ны последовательности (х,) будут поочередно все сильнее при- 
тягиваться к этим числам, с какого хо (0,1) ни начинался бы 
процесс (6.28). Говорят, что в этом случае имеет место устойчи- 
вый цикл периода 4, т.е. цикл д". 

Такой процесс образования новых циклов происходит с 
увеличением параметра А и далее. Точки Лу, Ло, Лу, й ‚в ко- 
торых имеет место зарождение циклов д”. ый 58. й , называ- 
ются точками бифуркации удвоения периода. 

Этому процессу бифуркаций удвоения периода можно при- 
дать наглядный вид, если отобразить на графике зависимость 
элементов цикла — значений устойчивых неподвижных точек 


отображений Ф®(х) (иначе, точек притяжения подпоследова- 


тельностей получаемой посредством МПИ (6.28) последователь- 
ности (х, )) — от значений параметра Я при А >1 (см. рис. 6.14). 


Последовательность (Л„) точек бифуркации удвоения пе- 
риода обладает определенной закономерностью: 


№» =: 

ит — —55=4.66920й 

Ап -Ли а 
Имеет постоянный предел, равный величине @ = 2.50290й , так- 
же отношение („1 /4„ , где через 4„ обозначено расстояние от 


п-1 
точки х=0.5 до ближайшего элемента цикла 8 ‚ соответст- 


вующего такому значению А, при котором х = 0.5 является эле- 
ментом того же цикла (рис. 6.14). Числа б и а называют посто- 
янными Фейгенбаума в честь открывшего эти закономерности 


американского математика (1978 г.). 
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й 


Рис. 6.14. Бифуркационная диаграмма циклов периода 2" 


Верхней границей значений Х, при которых получаемая с 
помощью (6.28) последовательность (х„) ведет себя указанным 


п 


* 
образом, т.е. имеет циклы ка ‚ является значение Д =3.57. 
Дальнейшее увеличение 7 приводит к срыву цикличности. В ка- 


ком-то диапазоне значений #> будет наблюдаться бесконеч- 
ное хаотическое блуждание точек последовательности (х’) в 
пределах промежутка (0, 1), с какого бы ху Е (0, 1) она не начина- 
лась. Затем снова из хаоса возникают устойчивые циклы, проис- 
ходят бифуркации удвоения периода и опять срыв в хаос. Такие 
чередования циклического (с разными периодами, например, 
12.2”, 10.2”, 6.2", 8.2", 7.2", 5.2" и др.) и хаотического по- 
ведения последовательности (х’„) имеют место в процессе уве- 


личения Л почти вплоть до предельного значения д=4. При 
этом самый большой (по А) промежуток цикличности после 


п 
циклов вида 5? будет иметь цикл периода 3-2” (при д>3.829), 
играющий особую роль в теории бифуркаций. 

Как зарождается порядок в хаосе, каковы связи между цик- 
лами разных периодов, какую роль играет последовательность 
обхода элементов цикла, что можно сказать об устойчивости тех 
или иных циклов — эти и другие вопросы возникают перед ма- 
тематиками, изучающими нелинейные отображения. Непростые 
ответы на них, достаточно наглядные в одномерном случае, по- 
зволяют понять природу многих сложных явлений (например, 
оценить принципиальные возможности долгосрочного прогно- 
зирования погоды). 
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6.4. О МЕТОДАХ РЕШЕНИЯ АЛГЕБРАИЧЕСКИХ 
УРАВНЕНИИ. МЕТОД БЕРНУЛЛИ 


Пусть требуется найти один, несколько или все корни мно- 
гочлена с действительными коэффициентами 


Р, (х):= арх" +ах" 1+й +аилх+аи, (6.30) 
т.е. решить в каком-то указанном смысле уравнение 
Р, (х)=0. (6.31) 


Если речь идет о нахождении только действительных кор- 
ней и, особенно, если нужно найти не все, а только некоторые из 
них, то есть резон в применении к алгебраическому уравнению 
(6.31) какого-либо из рассмотренных выше методов решения не- 
линейных скалярных уравнений /(х)=0 с Р, (х) в роли Х(х). 
При этом следует обратить внимание на то, что Р,(х) является 
определенной на всей действительной оси бесконечно диффе- 
ренцируемой функцией, и здесь можно применять методы, ис- 
пользующие производные Р, (х). Поскольку дифференцирование 
понижает степень многочлена, вычисление значений производ- 
ных потребует даже меньше арифметических действий, чем вы- 
числение значений исходного многочлена. Отсюда — целесооб- 
разность нахождения отдельных корней многочлена (в том числе 
и комплексных, см. [61, 72, 115, 129, 158]) методом Ньютона или 
гибридным алгоритмом, его использующим. 

Решение алгебраических уравнений (6.31) любым итераци- 
онным способом требует многократного вычисления значений 
многочленов (6.30). Эта промежуточная задача для многочленов 
намного проще, чем задача вычисления значений трансцендент- 
ных функций: нужно всего лишь при заданном х=хо простым 


перемножением находить степени хо при #=1,2,й ‚и (это и-1 
умножение), затем умножить их на коэффициенты (и умноже- 
ний) и сложить результаты (и сложений). Однако в практике вы- 
числений используют более эффективный способ вычисления 
значений многочленов — схему Горнера, позволяющую почти 


* 
вдвое уменьшить количество умножений ). Выведем этот спо- 
соб. 


* 
) Такой способ был известен в Китае еще в средние века и называл- 
ся Тянь-юань, а затем в начале ХХ века был «переоткрыт» в Европе анг- 
личанином Горнером и итальянцем Руффини. 
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Согласно теореме Безу, при любом хо найдутся числа Б; 
(1=0,1,2,й ‚п) такие, что 


арх" +ах"! +й +а,х+а, = 
— (х-—хо ох” +ых”? +Й +В 2х+Ь-1 )-ь, 


причем БР, =Р, (хо). Выполняя умножение в правой части тож- 
дества и приравнивая коэффициенты при одинаковых степенях 
х, получим совокупность и+1 равенств: 


В =а0, Ы =а1 +хоБд, > =а2 +хо, й й Ь, =а, +хоВи-. 


Таким образом, после и умножений (на одно и то же число хо) и 
п сложений приходим к искомому результату Ь„ = Р, (хо). 


Однотипность вычислений, производимых в схеме Горнера, 
позволяет организовать их в цикл, определяемый формулой 


Б; =а; +хоБ, 1, 


где 1=1,2,й ‚п, Б:=а0; на его выходе имеем значение 


Р, (хо ) ‘= Би : 

Числа ВБо,Ы,й ‚,Ь, далее будем называть коэффициентами 
схемы Горнера. При ручном счете эти коэффициенты удобно за- 
писывать в процессе вычислений под соответствующими разме- 
щенными в один ряд коэффициентами данного многочлена (6.30) 
в виде следующей таблицы: 


хо Вт В 


Пример 6.1. Доказать, что число 2 является единственным рацио- 


нальным корнем многочлена /5(х):= хх“ -3х3+2х+4 , причем про- 


стым. 
Все доказательство можно отразить следующей таблицей: 


В ее первой строке находятся коэффициенты данного многочлена Р5(х), 
во второй строке — коэффициенты схемы Горнера, примененной к Р5(х) 
при хо=2, означающие, что Р5(2)=0 и Р5(х)=(х-2)Р4(х), где 


Р4 (х)=х“+х3 -х2 -2х-2 (см. тождество, лежащее в основе вывода 
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схемы Горнера). Остальные строки — результаты применения схемы Гор- 
нера к многочлену Рл (х) (что отражено в таблице подчеркиванием) в точ- 
ках +1, +2, являющихся делителями свободного члена многочлена с це- 
лыми коэффициентами Р4(х) со старшим коэффициентом 1. Так как 
Ру (1) =-3, РА (-1=-1 Ра (2)=14, и Р4(-2)=6 ‚ то Ра(х) не имеет ра- 
циональных корней, а значит, и Р5(х) не имеет других рациональных 
корней, кроме 2, причем 2 не может быть двукратным корнем. 


Как видно из приведенного примера, схему Горнера удобно 
использовать для понижения степени алгебраического уравнения 
выделением линейного множителя, соответствующего известно- 
му вещественному корню. Поскольку в подавляющем большин- 
стве случаев эти корни бывают известны лишь приближенно, 
при понижении степени алгебраического уравнения неизбежна 
потеря точности, с которой могут быть найдены последующие 
корни. Это обстоятельство заставляет с осторожностью отно- 
ситься к выигрышу в вычислительных затратах, достигаемому 
таким понижением степени, когда находятся несколько корней 
многочлена последовательно корень за корнем. 

Существует способ вычисления корня многочлена (6.30) 
последовательно цифра за цифрой непосредственно по схеме 
Горнера, применяемой к специальным образом преобразованному 
многочлену; в [61] такой способ называется методом Горнера. 


* 
Более распространен метод выделения множителей ) [20, 
72, 99, 102, 129]. Последовательное выделение линейного мно- 
жителя этим методом базируется на применении схемы Горнера 
в точках последовательности приближений хо, х|,хо,й к иско- 


мому корню & многочлена Р,(х). Это оказывается равнознач- 
ным простым итерациям вида 


== Ри (0)хх 
Ра (о) Р,(хь)’ 


что позволяет использовать известные критерии сходимости 
МПИ. При нахождении пары комплексно сопряженных корней 
выделяют квадратичный множитель. Для этих целей нужна 
эффективная схема деления с остатком многочлена на квадрат- 
ный трехчлен, которую нетрудно получить по аналогии с выво- 
дом схемы Горнера. 

В случаях, когда вычисление корней многочлена ориенти- 
ровано на применение итерационных методов решения нелиней- 
ных уравнений общего вида, встает вопрос о сужении области 


Хр К =0,1,2,й , 


* 
) На самом деле, имеется несколько таких методов, из которых наи- 
более известен метод Лина (предпоследнего остатка), который и имеет- 
ся здесь в виду. 
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поиска корней. Здесь опять может оказаться полезной схема 
Горнера. Справедливо утверждение: 
если все коэффициенты схемы Горнера, примененной к 
многочлену Р,(х) в точке х=В>0, положительны, то 
правее В на оси Ох действительных корней Р, (х) нет. 


Это следует из тождества 
Р,(х)=(х- Вох” +Ы АЯ + Ри ох+Ь 1 )+ й 


показывающего, что Р,(х)>0 для любых х> В>0 ‚, в силу по- 
ложительности всех В; (1=0,1,2,й ‚п)и разности х- ДВ. 

Так, в примере 6.1, глядя на приведенную там таблицу, можно ска- 
зать, что многочлен Ра (х) (а значит, и Р5(х)) не имеет действительных 
корней, больших 2. 

Есть более конструктивные способы указания границ всех 
корней многочлена. 

Например, можно утверждать, что 

за верхнюю границу положительных корней многочле- 
на Р,‚ (х) с ад >0 можно принять число 


В 
В=1+т—, (6.32) 
90 
где т — индекс первого отрицательного коэффициента в 
ряду а, а2,й ‚а„ (иначе, разность между показателем сте- 
пени многочлена и показателем степени первого отрица- 
тельного члена), а В — максимум модулей всех отрица- 
ЕЗ 
тельных коэффициентов 


Действительно, заменив в Р,(х) неотрицательные коэффи- 
циенты 41, а2,Й ‚ат нулями, а все последующие — числом 
_В, при х>1 имеем: 


Р, (х) > адх” — В(х т +й +х+1)= 
п—т-1 п-т-1 
_1 В. 
ва -в  чьа Е: 
х-1 х-1 


+1 
хит 


57 — их" (&-1- В]> 


= 


0-1)" — В] 


® 
) В одних литературных источниках такое нахождение правой гра- 
ницы действительных корней называют методом Лагранжа [46, 61], в 
других — методом Маклорена [72]. 
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Так как последнее выражение в этой цепочке равенств и нера- 
венств равно нулю при х= А и больше нуля при х> К, значит, 
Р,(х)> 0 при всех х> В , т.е. правее К действительных корней 
нет. 

Любой метод нахождения верхней границы положительных 
корней можно приспособить для нахождения нижней (левой) 
границы отрицательных корней. Для этого достаточно преобра- 
зовать многочлен Р,(х) заменой #=—-х и для положительных 


корней многочлена (-1)"Р, (Е) найти верхнюю границу А”(на- 
пример, по формуле (6.32)); тогда число —А” будет искомой 


нижней границей ›. Так же, используя известный метод нахож- 


дения верхней границы в многочленах вт) и (-1)" в.) 
я х 


можно найти нижнюю границу положительных и верхнюю гра- 
ницу отрицательных корней многочлена Р, (х), т.е. отделить его 
корни от нуля. 

Зачастую более хорошие результаты показывает метод 
Вестерфильда получения симметричных границ расположения 
всех корней многочлена [72]. Согласно ему, 


модули всех корней (в том числе и комплексных) ири- 
веденного многочлена Р, (х) (т.е. при ад =1) лежат в круге, 
радиус которого не превосходит суммы двух наибольших из 


чисел Уат| ‚где т=1,2,й ‚п. 


Решение проблемы изоляции корней алгебраического урав- 
нения не имеет особой специфики, выделяющей ее из более об- 
щего случая нелинейных скалярных уравнений. Более продвину- 
тым здесь является решение вопроса о количестве действитель- 
ных корней. Можно указать простые способы выяснения воз- 
можного количества положительных и отрицательных корней 
по числу перемен знаков в последовательностях коэффициентов 
Р,(х) и Р„(—х). 

Так, теорема Декарта говорит о том, что 


число положительных корней уравнения (6.31) с уче- 
том их кратностей равно числу перемен знаков в последо- 
вательности коэффициентов ад, а1,й ‚аи (без учета нуле- 

вых коэффициентов) или на четное число меньше [61]. 
Более точный ответ на вопрос о числе действительных корней 
алгебраического уравнения можно получить с помощью широко 
известной в алгебре теоремы Штурма (см. [20, 46, 61] и др.). 


* 
) Множитель (-1)" поставлен ради положительности старшего ко- 
эффициента преобразованного многочлена. 
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Если при этом уже затрачены усилия на составление системы 
Штурма, то ее можно использовать и для нахождения промежут- 
ков изоляции действительных корней. 

Имеются и другие способы нахождения границ действи- 
тельных и комплексных корней алгебраических уравнений, вы- 
яснения количества положительных и отрицательных корней, а 
также их изоляции. 


Одним из наиболее эффективных методов нахождения 
всех или почти всех корней алгебраического уравнения, как 
вещественных, так и комплексных, является метод Лобачевского, 


предложенный выдающимся русским математиком в 1834 году”). 
Основная идея метода заключается в последовательном приме- 
нении операции квадрирования корней. Суть ее такова. 

С помощью обобщенной теоремы Виета легко показать, что 
если корни &1,&2,й ‚&„ уравнения (6.31) сильно отличаются по 


модулю (что, кстати, гарантирует их вещественность), а именно, 


[Е1>>2|>>( >> „|, то 

ый а 

2—5 559—5 Й , би : 

40 ый Яп-1 
При возведении их в натуральную степень будут получаться все 
более удаленные друг от друга числа. Одна из макроопераций 
метода Лобачевского (квадрирование корней) состоит в том, что 
от данного уравнения с корнями &1, 62,й ‚&„ переходят к новому 
уравнению той же степени с коэффициентами 


Чип 


д=а? +2 (Сар ан; @=0,Ь2, ‚п) (6.33) 
у 


и корнями /; =-? (1=1,2,й ‚п). После ее многократного при- 
менения, когда в (6.33) будет практически сведена на нет роль 
второго слагаемого (удвоенной суммы парных произведений), 
извлечением корней соответствующих степеней можно прибли- 
женно найти модули корней исходного уравнения. 

Более подробно о методе Лобачевского, его реализациях, 
разных ситуациях, с которыми можно встретиться при его при- 
менении, см. в книгах [20, 61, 72, 98, 129]. Одна из последних 


*) Этот метод называют также методом Лобачевского-Греффе или 
методом Данделена в честь швейцарского математика Греффе и фран- 
цузского математика Данделена, причастных к одним из первых версий 
метода. Впоследствии метод Лобачевского неоднократно совершенство- 
вался. 
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версий этого не самого простого метода содержится в брошюре 
А.А. Беланова [17] (ориентированной, правда, на программируе- 
мые микрокалькуляторы, а не на компьютеры). 


Рассмотрим простой способ приближенного вычисления 
наибольшего по модулю действительного корня алгебраического 
уравнения (6.31), который был опубликован И. Бернулли в 
1732 г. и называется методом Бернулли. 

Запишем уравнение (6.31) в виде 


“= сх" а +Й +6, 1х+су. 


С помощью коэффициентов с; = (1=1,2,й ‚п) этого урав- 
нения будем строить о За (Минь уе по рекур- 
рентной формуле 
Итнк 2 ИЕ +22 +Й Силин +Спик, (6.34) 
начиная этот процесс при К =1,2,й ‚пи со значений 
и =0, м2 =0, й, и, 1=0, и, =К 


(как это рекомендовано Хильдебрандом [72]). 

На основе обобщенной теоремы Виета можно выяснить, что 
эта последовательность обладает замечательным свойством: если 
Е, &2,й ‚&„ — корни многочлена Р, (х), то 


Я +52 +й +6» =Ии-+1, 


2 50 2 
51 +62 +Й +61 =Ии+2, 


Взяв отношение двух соседних членов последовательности 
(ик), выраженных через степени корней, имеем: 


А-+1 +1 К-+1 
Ик +1 Щ_ 91 +28 + +, 
ик ЧИ +61 


К-+1 +1 
=“ 


А о 048 
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. Ик 
Если | |> [Е] \У1={2,й ‚п}, то, очевидно, —""И -> &1. 
Ик К 
К такому же результату придем и в случае, когда &, — не про- 
стой, а т-кратный корень (выражения в квадратных скобках в 
числителе и в знаменателе (6.35) имеют пределом число т). 


и В 
Если сходимость последовательности отношений —" + не 
Ик 
обнаруживается, но существует предел последовательности ве- 
личин 
Е +2 Е +2 
«(2 +Й + = 
Ип+к+2 _ #2 61 61 
К К 
и 
и-+К 
1+ 52 +й + Ы 
О 1 
то в этом случае данное уравнение имеет два действительных 
корня & =-&>, наибольших по модулю. При достаточно боль- 


ших К (желательно, четных) они могут быть найдены прибли- 


и 
женным равенством & 2 =+ —" +2  Хаотическое поведение 
Ик 
© Ии+к+2 
последовательности отношений ——^—= говорит о том, что пре- 
в 
п-+К 


валирующими являются комплексные корни. Незначительной 
доработкой метод Бернулли можно приспособить и для этого 
случая (см. [72]). 

Как видно, метод Бернулли весьма близок к степенному ме- 
тоду решения частичной проблемы собственных значений, более 
тщательно рассмотренному в $ 4.2. Зная в тонкостях один из этих 
методов, можно многое сказать о поведении другого. 


УПРАЖНЕНИЯ 


6.1. Дайте обоснованное заключение о факте и скорости сходимости 
последовательности 


Га 1 
Хк+1 247% 5% +1, А=0,12,й, хо =0 


на отрезке [0, 1]. С какой точностью можно приблизиться к Шт хх за 10 
>50 
шагов? Запишите итерационный процесс Ньютона, имеющий тот же предел. 
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6.2. Запишите сходящийся процесс простых итераций для нахожде- 


ния корня уравнения хз —2х? -4х-7=0, изолированного на промежут- 
ке [3, 4]. 


6.3. Подготовьте расчетные формулы для нахождения корня уравне- 
ния 2—|ех-—х=0 методом простых итераций. Выбрав начальное при- 
ближение, подсчитайте, за сколько итерационных шагов можно гаранти- 
ровать получение корня с точностью == 10°. Сделайте четыре шага 
МПИ и по два полных шага Д? -процесса Эйткена и метода Вегстейна. 


6.4. Сравните эффективность следующих двух подходов к вычисле- 
нию значений Р, (хх) и Р/(хь) при нахождении алгебраического корня 


В (к ) : 

Рихь) 

А) вычислив степени ху , использовать их затем в Р,(хк) и Р/(хх ); 
Б) применить схему Горнера сначала к многочлену Р,(х) в точ- 


ке хх ‚ затем к его неполному частному — результату первого ее примене- 
ния (правомерность этого подхода обоснуйте). 


уравнения Р, (х) =0 методом Ньютона ху.1 =хх — 


6.5. Разработайте алгоритм, позволяющий найти наибольший корень 
многочлена Р,(х) с заданной точностью только одними проверками на 
положительность коэффициентов схемы Горнера. 


6.6. А) Докажите, что если числа К; и К› — правые границы дейст- 
вительных корней многочленов О(х) и Т(х) соответственно, то за верх- 
нюю границу действительных корней многочлена Р(х):=О(х)+Т(х) мож- 
но принять число А=тах{А!, >}. 

Б) Для многочлена Р5(х)=х” —2х4 +152 —32х+1 найдите границы 


положительных корней сначала непосредственно по формуле (6.32), затем 
на основе результата А, выполняя подходящее представление Р5(х) сум- 


мой О(х)+Т(х) так, чтобы получить как можно более точную границу. 
В) Найдите границу модулей всех корней данного многочлена Р5(х) 
методом Вестерфильлда. 


6.7. Пусть 61, &› — вещественные корни уравнения х? —рх+а=0. 
Убедитесь в справедливости равенств 


2, =2 8-3 
61 +62 =из, 61 +62 =и4, 6] +6) =И5, 


где и; — элементы последовательности Бернулли-Хильдебранда, зада- 
ваемой формулой (6.34). 


6.8. Дано уравнение х4 —3х3 —7х2 +15х+18=0. Сделайте 5—6 при- 
ближений к его старшему корню методом Бернулли. 
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ГЛАВА7 |МЕТОДЫ РЕШЕНИЯ СИСТЕМ 


НЕЛИНЕЙНЫХ УРАВНЕНИЙ 


Рассматривается ряд методов решения систем алгебраи- 
ческих и траисцендентиых уравнений. Среди них метод про- 
стых итераций, метод Ньютона в разных модификациях (в 
частности, п-полюсный метод Ньютона), метод Брауна, 
метод секущих Бройдена. Показывается связь между данной 
задачей и задачей безусловной минимизации функции нескольких 
переменных. Проводится сравнение методов на примере 
решения конкретной системы. С единых позиций изучается 
сходимость основного и упрощенного методов Ньютона и 
метода, получаемого из метода Ньютона применением 
итерационного процесса Шульца для приближенного обращения 
матриц Якоби. 


7.1. ВЕКТОРНАЯ ЗАПИСЬ НЕЛИНЕЙНЫХ _ 
СИСТЕМ. МЕТОД ПРОСТЫХ ИТЕРАЦИИ 


Пусть требуется решить систему уравнений 
Ом, хо,й ‚хи)=0, 
> (ху, х>,й 2) =0, 
Лия, х2,й ‚хи)=0, 


где /, /2,й , /„ — заданные, вообще говоря, нелинейные (среди 
них могут быть и линейные) вещественнозначные функции и 
вещественных переменных х1, х2,Й ‚хи. 


(1.1) 


Обозначив 
хм Л()) (Абльх>й хи) 0 
х ›хоЙ 0 
х— 2 || оды л®) |1 * хи) 68, 
+ + + к 
Хп Ти(х) и(хьхй в 0 
данную систему (7.1) можно записать одним уравнением 
Е(х)=0 (7.1а) 


относительно векторной функции Е векторного аргумента х. 
Таким образом, исходную задачу можно рассматривать как зада- 
чу о нулях нелинейного отображения Ё:К„ -> К,. В этой поста- 
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новке она является прямым обобщением основной задачи преды- 
дущей главы — задачи построения методов нахождения нулей 
одномерных нелинейных отображений. Фактически это та же за- 
дача, только в пространствах большей размерности. Поэтому 
можно как заново строить методы ее решения на основе разрабо- 
танных выше подходов, так и осуществлять формальный перенос 
выведенных для скалярного случая расчетных формул. В любом 
случае следует позаботиться о правомочности тех или иных опе- 
раций над векторными переменными и векторными функциями, а 
также о сходимости получаемых таким способом итерационных 
процессов. Часто теоремы сходимости для этих процессов явля- 
ются тривиальными обобщениями соответствующих результа- 
тов, полученных для методов решения скалярных уравнений. 
Однако не все результаты и не все методы можно перенести со 
случая и=1| на случай п>2. Например, здесь уже не будут рабо- 
тать методы дихотомии, поскольку множество векторов не упо- 
рядочено. В то же время, переход от и=1 ки>2 вносит в задачу 
нахождения нулей нелинейного отображения свою специфику, 
учет которой приводит к новым методам и к различным модифи- 
кациям уже имеющихся. В частности, большая вариативность 
методов решения нелинейных систем связана с разнообразием 
способов, которыми можно решать линейные алгебраические за- 
дачи, возникающие при пошаговой линеаризации данной нели- 
нейной вектор-функции Ё(х). 


Начнем изучение методов решения нелинейных систем с 
наиболее простого метода. 
Пусть система (7.1) имеет вид (преобразована к виду): 
хм = ФЕ, х2,й „Вий 
х2 =Ф2(хрьх>,Й хи), 


(1.2) 
хи = Фи (1, х›,йЙ , %) 
или иначе, в компактной записи, 
х=Ф(х), (7.2а) 


где 
Фи(х) ФЕ, х2,й Зы 
) ‚й ) 
+ 


+ 
фи(х) Фи (хр, х2,й Жи) 
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Для этой задачи о неподвижной точке нелинейного отображе- 
ния Ф: В, > В, запишем формально рекуррентное равенство 


хе) Фи), Е=0,1,2,й , (1.3) 
которое определяет метод простых итераций (МПИ) (или ме- 
тод последовательных приближений) для задачи (7.2). 

Если начать процесс построения последовательности К )) 


Г 
с некоторого вектора х(0) = (9, «©,» ‚х(©)) и продолжить по 
формуле (7.3), то при определенных ‘условиях эта последователь- 
ность со скоростью геометрической прогрессии будет прибли- 


жаться к вектору х — неподвижной точке отображения Ф(х). А 
именно, справедлива следующая теорема. 


Теорема 7.1. Пусть функция Ф(х) и замкнутое мно- 
жество М < р(Ф) с К, таковы, что: 


1) Ф®)ЕМ УхеМ; 
2) За<!:|Ф()-Ф(]]|<а-|х-х| Ух,хеЕМ. 
Тогда Ф(х) имеет в М единственную неподвижную 


* 
точку х ; последовательность х(® ‚ определяемая МПИ 


(7.3), при любом х(0) 
оценки 


"к =-— ть ОС 3] = = 9 -х@)]| ухем. 


* 
ЕМ сходится к х и справедливы 


Доказательство этой теоремы почти полностью повторяет до- 
казательство теоремы 6.1 и даже несколько проще его. Однако и 
практическая ценность такой теоремы не так велика из-за неконст- 
руктивности ее условий. В случаях, когда имеется хорошее началь- 


ное приближение х 9 к решению х , больший интерес для прило- 
жений может представить следующий аналог теоремы 6.2. 


Теорема 7.2. Пусть функция Ф(х) дифференцируема) 
в замкнутом шаре”) 9% ®, „)< Г(Ф), причем 34 е (0, 1): 


* 
) Здесь и далее под дифференцируемостью понимается дифферен- 
цируемость по Фреше (см. приложение 1). 


%* 
) Т.е. на множестве 5 точек хе В, таких, что |^- х)| <» ; 
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зир|Ф'(х]|< а. Тогда, если центр х(0) и радиус г шара 5, 
хЕ5 
таковы, что &®-к®] <= 1-9), то справедливо за- 


ключение теоремы 7.1 се М =. 


Как видим, теорема 7.2 — это просто соответствующим обра- 
зом отредактированная для многомерного случая теорема 6.2. Пе- 
реложение доказательства теоремы 6.2 на этот случай менее триви- 
ально из-за того, что в В, при п>1 не работает дифференциальная 
теорема о среднем в привычном виде формулы конечных прираще- 
ний Лагранжа. Но если воспользоваться теоремой о среднем, на- 
пример, в виде неравенства (см. [80, 139 и др.]) 


[ЕС - РО заре + - Нк, 


0<1<1 
то доказательство теоремы 7.2 становится более прозрачным. 
Другой путь доказательства теоремы 7.2 — покоординатное 


применение одномерной формулы Лагранжа и использование 
конкретных матричных и векторных пар норм [44, 61]. 

Если потребовать непрерывную дифференцируемость 
Ф(х), то более просто перейти от теоремы 7.1 к теореме 7.2, 
применив следующее утверждение [177]. 


Лемма 7.1. Пусть функция Ф: В, > К,„ непрерывно 
дифференцируема на множестве М < Г(Ф) и пусть 
|Ф'()|<Г УхЕМ. Тогда Ф(х) удовлетворяет на множе- 
стве М условию Лиишица 


[ю)-Ф($] < Ик- |. 


Запись МПИ (7.3) в развернутом виде, т.е. совокупность ре- 
куррентных равенств 


яр оВ л , 500) 
хе) = 2 («®, х®, в, х®), 


хе) =, ®, х(®), в, х(®)} 


напоминает изученный ранее (см. гл.3) МПИ для СЛАУ, который 
укладывается в эту схему, если все функции ф; — линейные. 


Учитывая, что в линейном случае, как правило, по сравнению с 
МПИ более эффективен метод Зейделя (см. (3.12) и теорему 3.7), 
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здесь тоже может оказаться полезной подобная модификация. А 
именно, вместо (7.3) можно реализовать следующий метод по- 
координатных итераций: 


ХИН) = (х®, х(Ю, й ‚х®, х@)}, 


хе) = о, х(®, п, х@, х(®) 


х(+) =, хе, в, ХЕ, х(®)). 


Заметим, что как и для линейных систем, отдельные урав- 
нения в методе (7.4) неравноправны, т.е. перемена местами урав- 
нений системы (7.2) может изменить в каких-то пределах число 
итераций и вообще ситуацию со сходимостью последовательно- 
сти итераций. Чтобы применить метод простых итераций (7.3) 
или его зейделеву модификацию (7.4) к исходной системе (7.1), 
нужно, как и в скалярном случае, сначала тем или иным спосо- 
бом привести ее к виду (7.2). Это можно сделать, например, ум- 
ножив (7.1а) на некоторую неособенную ихи-матрицу -А и 
прибавив к обеим частям уравнения — АЁ(х) =0 вектор неиз- 
вестных х. Полученная система 


х=х- АЁ(х) 


эквивалентна данной и имеет вид задачи о неподвижной 
точке (7.2а). Проблема теперь состоит лишь в подборе матрично- 
го параметра А такого, при котором вектор-функция 
Ф(х):= х- АЁ(х) обладала бы нужными свойствами. 


(7.4) 


7.2. МЕТОД НЬЮТОНА, ЕГО РЕАЛИЗАЦИИ 
И МОДИФИКАЦИИ 


Пусть (А’) — некоторая последовательность невырожден- 


ных вещественных их и-матриц. Тогда, очевидно, последова- 
тельность задач 


х=х-А,Р(х), К=0,1,2,й 


имеет те же решения, что и исходное уравнение (7.1а), и для 
приближенного нахождения этих решений можно формально за- 
писать итерационный процесс 


хе — к А, Е), ОТ, (7.5) 
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имеющий вид метода простых итераций (7.3) при 
Ф(х):=Ф,(х):=х-А,Р(х). В случае А; =А это, как показано 
в конце предыдущего параграфа, — действительно МПИ с ли- 
нейной сходимостью последовательности |х Ю). Если же Ах 


различны при разных А, то формула (7.5) определяет большое 
семейство итерационных методов с матричными параметрами 
Ах. Рассмотрим некоторые из методов этого семейства. 


Положим Ау = [=*(«®) в где 
эл дл, дй 


9х 0х дх„ 
ав ал, вы 
Е'(х)=/Л(х)=| дм дж дх„ 


91, 8) Й 91, 

9х 0х р 
— матрица Якоби вектор-функции Е(х). Подставив это Ах в 
(7.5), получаем явную формулу метода Ньютона 


хе = х@ [к ®)] Е), (1.6) 


обобщающего на многомерный случай скалярный метод Ньюто- 
на (5.14). Эту формулу, требующую обращения матриц на каж- 
дой итерации, можно переписать в неявном виде: 


г’) 5+ — «6-Е. (1) 


Применение (7.7) предполагает при каждом К = 0,1, 2,й 
решение линейной алгебраической системы 


Е’) р®) =-= ©) 


й Г 
относительно векторной поправки р = (>°, р®,й ‚ Р®) 5 


а затем прибавление этой поправки к текущему приближению 
для получения следующего: 


хе) — к + р. 


К решению таких линейных систем можно привлекать самые раз- 
ные методы как прямые, так и итерационные (см. ГЛ. р 3) в зави- 
симости от размерности и решаемой задачи и специфики матриц 
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Якоби „Л (о ) (например, можно учитывать их симметрию, раз- 
реженность ит.п.). 

Сравнивая (7.7) с формальным разложением Ё(х) в ряд 
Тейлора 


2(®)= Е) + Е - +1 О О 


видим, что последовательность (®) в методе Ньютона получа- 
ется в результате подмены при каждом А = 0,1,2,й нелинейного 
уравнения К(х)=0 или, что то же (при достаточной гладкости 
Е(х)), уравнения 


в) к хх) Е хх} +Й =0 


линейным уравнением 
Е ® )+ г’) (.-х@)- 0, 


т.е. пошаговой линеаризацией”). Как следствие этого факта, бо- 
лее тщательно изученного в В} (см. $ 5.4), можно рассчитывать, 
что при достаточной гладкости Е(х) и достаточно хорошем на- 
чальном приближении х(0) сходимость порождаемой методом 
Ньютона последовательности (х(* )) к решению х будет квадра- 
тичной и в многомерном случае. Имеется ряд теорем, устанавли- 
вающих это при тех или иных предположениях (см. [13, 61, 80, 
129 и др.]). В частности, одна из таких теорем приводится ниже 
(теорема 7.5 в $ 7.8). 

Новым, по сравнению со скалярным случаем, фактором, ос- 
ложняющим применение метода Ньютона к решению и-мерных 
систем, является необходимость решения и-мерных линейных 
задач на каждой итерации (обращения матриц в (7.6) или реше- 
ния СЛАУ в (7.7)), вычислительные затраты на которые растут с 
ростом и, вообще говоря, непропорционально быстро. Уменыше- 
ние таких затрат — одно из направлений модификации метода Нью- 
тона. 


*) Обратим внимание на некоторую сознательную некорректность 
использования здесь термина «линейный», идущую от «школьной» при- 
вычки называть функцию у=ах-+ь линейной, хотя она не является ли- 
нейным оператором, ибо не удовлетворяет условию однородности. В [68] 
в таких случаях используется термин «аффинная аппроксимация». 
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Если матрицу Якоби Е’(х) вычислить и обратить лишь 
один раз — в начальной точке х(0), то от метода Ньютона (7.6) 


придем к модифицированному методу Ньютона”) 
1 
хо — [©]. (1.8) 


Этот метод требует значительно меньших вычислительных за- 
трат на один итерационный шаг, но итераций при этом может по- 
требоваться значительно больше для достижения заданной точ- 
ности по сравнению с основным методом Ньютона (7.6), по- 


—1 
скольку, являясь частным случаем МПИ (с А := Ш] ), он 
Ж* 


имеет лишь скорость сходимости геометрической прогрессии 
Компромиссный вариант — это вычисление и обращение 
матриц Якоби не на каждом итерационном шаге, а через несколько 
шагов (иногда такие методы называют рекурсивными [176]). 
Например, простое чередование основного (7.6) и модифи- 
цированного (7.8) методов Ньютона приводит к итерационной 


формуле 
(ЕО = х® Ак} Ак = АкР К} (7.9) 


где А, = [©] ' К=0.,1,2.й „За х(®) здесь принимается 
результат последовательного применения одного шага основно- 
го, а затем одного шага модифицированного метода, т.е. двух- 
ступенчатого процесса 


2 -х® А, Е), 
хе) 2 АЕ). 


Доказано, что такой процесс при определенных у о порож- 
А 


(1.10) 


дает кубически сходящуюся последовательность (х 

Задачу обращения матриц Якоби на каждом А-м шаге мето- 
да Ньютона (7.6) можно попытаться решать не точно, а прибли- 
женно. Для этого можно применить, например, итерационный 
процесс Шульца (см. $ 3.6), ограничиваясь минимумом — всего 
одним шагом процесса второго порядка, в котором за начальную 
матрицу принимается матрица, полученная в результате преды- 
дущего (К-1)-го шага. Таким образом приходим к методу 


ЕЗ 
) В книге [181] так называется совсем другая модификация, свя- 
занная с оптимизацией шага в «ньютоновском направлении». 


Ж* 
) Независимо от МПИ линейная сходимость модифицированного 
метода Ньютона (7.8) обосновывается в $ 7.8 теоремой 7.6. 
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Ньютона с последовательной аппроксимацией обратных 
матрии: 


х(+0) = А, Ех), 


(1.11) 
+, ЕР )А,, Ар. = Ар +А,Ж, 


где =0,1,2.й ;а х(0) и Ад — начальные вектор и матрица 
— 
(= [Е О] соответственно). Этот метод (будем называть 


его более коротко ААМН — аппроксимационный аналог мето- 
да Ньютона) имеет простую схему вычислений — поочередное 
выполнение векторных в первой строке и матричных во второй 
строке его записи (7.11) операций. Скорость его сходимости поч- 
ти так же высока, как и у метода Ньютона. Как будет показано в 
$ 7.8, последовательность «© может квадратично сходиться к 


решению х уравнения Р(х) = 0 (при этом матричная последова- 


тельность (А; ) также квадратично сходится к А“ = [Е {8 я 
т.е. в нормально развивающемся итерационном процессе (7.11) 
должна наблюдаться достаточно быстрая сходимость (|, |) к 
нулю). 

Применение той же последовательной аппроксимации об- 
ратных матриц к простейшему рекурсивному методу Ньютона 
(7.9) или, что то же, к двухступенчатому процессу (7.10) опреде- 
ляет его аппроксимационный аналог 


2(® — х@) - АКЕ(®), х (+1) — (4) - АЕ), 


(1.12) 
Ч) ЕР А,, Ах =Ау; +А’Чх, 


который, как и (7.9), также можно отнести к методам третьего 
порядка. Доказательство кубической сходимости этого метода 
требует уже более жестких ограничений на свойства Е(х) и бли- 


* 1 
зость х(0) кх ‚ Арк [®*(«©)] ‚ чем в предыдущем методе. За- 
метим, что к улучшению сходимости здесь может привести по- 
вышение порядка аппроксимации обратных матриц, например, за 


ы (©) 
Требования к степени близости Ад к |К ( ) ‚ наряду с дру- 


гими требованиями, гарантирующими сходимость метода, см. далее в тео- 
реме 7.7 и следствии 7.1. 
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счет добавления еще одного слагаемого в формуле для подсчета 
Ар. (см. (3.34): 


2 
Ах. 1 = Ау +А, ФР, +А, р. 


На базе метода Ньютона (7.6) можно построить близкий к 
нему по поведению итерационный процесс, не требующий вы- 
числения производных. Сделаем это, заменив частные производ- 
ные в матрице Якоби ./(х) разностными отношениями, т.е. под- 

‚М -—1 
ставив в формулу (7.5) вместо А; матрицу хо, в“) ] ‚ где 


и хуй ,х,)- АЙ ,хрьй = 


й. 
Л Ь = 
При удачном задании последовательности малых векторов 


в) = 


76 
в® = (+ 5 „®) (постоянной или сходящейся к нулю) по- 
лученный таким путем разностный (или иначе, дискретный) 
метод Ньютона 


1 р 

хех _ [7 в) Е) (17.13) 

имеет сверхлинейную, вплоть до квадратичной, скорость сходи- 

мости и обобщает на многомерный случай метод (5.29). При за- 

дании векторного параметра в — шага дискретизации — следует 

учитывать точность машинных вычислений ( тасйеру ), точность 

вычисления значения функций Х;, средние значения получаемых 
приближений (см. [68]). 

Можно связать задание последовательности ь( ) ) с какой- 

либо сходящейся к нулю векторной последовательностью, на- 


пример, с последовательностью невязок (Г х(® )) или поправок 
(>). Так, полагая а = кг -х®, где 71=Ый и, & 
К=1,2,й ‚ приходим к простейшему методу секущих — 
обобщению скалярного метода секущих (5.32): 


п ми ба 
где 
в“ ) х (1) | ы 
ы п м ‚х®)- (ев „яой ‚ х0) | 
|| 


/ 1 Ь 15 
к=1,2,3,й . 
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Этот метод является двухшаговым и требует задания двух 


начальных точек х . И х(1). Как было показано в ГЛ.5, при и =1 


1+55 
сходимость метода (7.14) имеет порядок и“ Можно рассчи- 


тывать на такую же скорость и в многомерном случае. 

К методу секущих так же, как и к методу Ньютона, можно 
применить пошаговую аппроксимацию обратных матриц на ос- 
нове метода Шульца. Расчетные формулы этой модификации 
легко м те в совокупности т ААМН (7.11) 


матрицу Е” (+1) на матрицу Вх, х(0} из (7.14). 


х А 

Замечание 7.1. Если в одномерном случае разные подходы к линеа- 
ризации Г(х) приводили к одной и той же формуле секущих (5.32), то для 
функции и переменных Ё(х) известно несколько разных обобщений этой 
формулы в зависимости от того, на какую основу положена линеаризация 
(к) в текущей точке. Предложенный здесь простейший метод секущих 
(7.14) является одним из семейства методов секущих, базирующихся на 
аппроксимации матриц Якоби. Линейная интерполяция Ё(х) в В, может 
привести к ряду других методов секущих (см., например, [139]). Среди 
множества таких методов особый интерес представляет метод секущих 
Бройдена; этому методу посвящен $5 7.4. 


Замечание 7.2. Для останова процесса вычислений в быстросходя- 
щихся методах таких, как метод Ньютона, методы секущих и т.п., часто 
вполне успешно применяют простой критерий: 


= * 
| к ] <= > 9510р, х я х(®. (7.15) 
Это можно объяснить двумя причинами. Во-первых, оценки погрешности 
здесь довольно «дороги». Имеется в виду как их получение (особенно для 
различных модификаций базовых методов), так и их реальное примене- 
ние. Во-вторых, в силу своей быстрой сходимости, к моменту достижения 


требуемой малости нормы поправки эти методы набирают такую инер- 
цию, что зачастую «проскакивают» установленный порог точности, т.е. 


* 
выход по критерию (7.15) дает значение | = х® | значительно (иногда 


* 
на несколько порядков) меньшее, чем =, см. пример в $ 7.7. ) Отслежи- 
вать факт сходимости в процессе итераций для того, чтобы реагировать на 


* 
) Как отмечается в [68], для метода Ньютона установлены неравен- 


Е * = р 
0.5] 5 = к-т 3] = 2 —х® Ч, 
подтверждающие высказанные соображения. В соответствии с этими не- 
равенствами срабатывание критерия (7.15) для метода Ньютона означает, 
= * 
что уже вектор х(—1) может быть принят за решение х , но поскольку 
подсчитан вектор х`”’, полагаем 


ства 
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возможную расходимость в случаях, когда заранее не обеспечены условия 
сходимости применяемого метода, можно с помощью текущих проверок 
на уменьшение от шага к шагу поправок и невязок, т.е. выполнение нера- 
венств 


| о 2) и [<] <] Е. (7.16) 


7.3. МЕТОД БРАУНА 


В отличие от пошаговой линеаризации векторной функции 
* 
Е(х), приведшей к методу Ньютона (7.6), Брауном (1966 г.) ) 
предложено проводить на каждом итерационном шаге поочеред- 
ную линеаризацию компонент вектор-функции Е(х), т.е. линеа- 
ризовать в системе (7.1) сначала функцию }|, затем № ит.д., и 
последовательно решать получаемые таким образом уравнения. 
Чтобы не затенять эту идею громоздкими выкладками и лишни- 
ми индексами, рассмотрим вывод расчетных формул метода 
Брауна в двумерном случае. 
Пусть требуется найти решение системы 
| (х, у)=0, 
&(х, у)=0, 
и пусть уже получены приближения хх, Ух. 
Подменим первое уравнение системы (7.17) линейным, по- 
лученным по формуле Тейлора для функции двух переменных: 
Л (сх, у) = Лок, Ук) Ли (хь, УК) хь)+ ук, У) - Ур) =0. 


Отсюда выражаем х (обозначим этот результат через х ): 


Ио, ук) + -У). @48) 


(1.17) 


ния 
К, Ук) 
При у = ух находим значение Хх, переменной х: 
= _ Лок» Ук) 
ХЕХ - т , 
ЛО» Ук) 


которое будем считать лишь промежуточным приближением (т.е. 
не хх. 1 р поскольку оно не учитывает второго уравнения системы 


(7.17). 
*) Ссылки на первоисточники можно найти в [139]. 
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Подставив в 2(х, у) вместо х переменную х =х(у), придем 
к некоторой функции С(у):= е(х, у) только одной переменной у. 
Это позволяет линеаризовать второе уравнение системы (7.17) с 
помощью формулы Тейлора для функции одной переменной: 
&(, у) = 6+) +6" Щу- к) =0. (7.19) 
При нахождении производной С’у) нужно учесть, что 
@(у)= &(х (>), у) есть сложная функция одной переменной у, 
т.е. применить формулу полной производной 


С'(›) = 8х (, у)-х,+8у(, у). 
Дифференцируя по у равенство (7.18), получаем выражение 


—, № (4 › УЕ ) 

р ИЕ. 
№ (хь, Ук) 

подстановка которого в предыдущее равенство при у=ух, 

Х = Хх дает 


а ВОВ) зрь 
в и) 69. 
При известных значениях С(у,)= <(хк, Ур) и С’(Уь) теперь 
можно разрешить линейное уравнение (7.19) относительно у 
(назовем полученное значение уз.1): 
(к) _ 
Сук) 


Ув = кб У 


_ &Ск, ук) Лх и» Ук) 
Би, Ук)» Ук) Лу, к) 5х (Сь, Ук) 
Заменяя в (7.18) переменную у найденным значением ух.1, при- 
ходим к значению ху+1: 


Хьы = ХУ ) — 


=х, бук) + Лу, бы = 24) 


1 
Лик, Ук) 
Таким образом, реализация метода Брауна решения дву- 
мерных нелинейных систем вида (7.17) сводится к следующему. 
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При выбранных начальных значениях хо, уд каждое после- 
дующее приближение по методу Брауна находится при 
К=0,1,2,й с помощью совокупности формул 


$ р РОКУ. 
Ёбь, Ук) 
м вк, Ук): Ли, Ук) 


Иов ук) - Л Ух, Ук), 
_ Лк, ук) Чак Лу(хь, Ук) 
> Лк» Ук) 

А = ХЕ Рь, Ук = УЕ Ч, 


счет по которым должен выполнятся в той очередности, в кото- 
рой они записаны. 
Вычисления в методе Брауна естественно заканчивать, ко- 


гда выполнится неравенство тах{|ру_1|, 91|} < = (с результатом 


й 


(", у"): = (хь, Ух )). В ходе вычислений следует контролировать 
немалость знаменателей расчетных формул. Заметим, что функ- 
ции / и © вэтом методе неравноправны, и перемена их ролями 
может изменить ситуацию со сходимостью. 

Указывая на наличие квадратичной сходимости метода 
Брауна, в [139] отмечают, что рассчитывать на его ббльшую по 
сравнению с методом Ньютона эффективность в смысле вычисли- 
тельных затрат можно лишь в случае, когда фигурирующие в нем 
частные производные заменяются разностными отношениями. 


7.4. МЕТОД СЕКУЩИХ БРОЙДЕНА 


Чтобы приблизиться к пониманию идей, лежащих в основе 
предлагаемого вниманию метода, вернемся сначала к изучавше- 
муся в двух предыдущих главах одномерному случаю. 

В процессе построения методов Ньютона и секущих реше- 
ния нелинейного скалярного уравнения. 


1) =0 (1.20) 


нкция /(х) в окрестности текущей точки х; подменяется ли- 
У р У р 
нейной функцией (аффинной моделью) 


Фик (аь, х):= Лак) +ар(х-хь). (7.21) 
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Приравнивание к нулю последней, т.е. решение линейного 
уравнения 


+ -хь)=0, 
порождает итерационную формулу 


—1 
хьы = хк фак Л(хь) (7.22) 
для вычисления приближений к корню уравнения (7.20). 

Если потребовать, чтобы заменяющая функцию Х(х) вбли- 
зи точки х; аффинная модель ф; (ах, х) имела в этой точке оди- 
наковую с ней производную, то, дифференцируя (7.21), получаем 
значение коэффициента 

—= ий 
Як > у (хк), 


подстановка которого в (7.22) приводит к известному методу 
Ньютона (5.14). Если же исходить из того, что наряду с равенст- 
вом Фу (а, хк) = (хх) должно иметь место совпадение функций 
1) и Ф’‚(аь,х) в предшествующей х; точке ху, т.е. из ра- 
венства 
ФЕ (ак, хк-) = Ло, 
или, в соответствии с (7.21), 
Ок) + ак (ХЕ =) =, (7.23) 
то получаем коэффициент 
де Лек) -Л@ь) 
— ) 
ХХ 

превращающий (7.22) в известную формулу секущих (5.32). 

Равенство (7.23), переписанное в виде 

ар (хх) = Ло) ЛО), 

называют соотношением секущих в Е\ [68]. Оно легко обобща- 
ется на и-мерный случай и лежит в основе вывода метода Брой- 
дена. Опишем этот вывод. 

В п-мерном векторном пространстве К, соотношение се- 
кущих представляется равенством 


ВО -х) = Рк 0) - Ех ®), (1.24) 


где х-0, х) — известные п-мерные векторы, Ё: В, >В, — 
данное нелинейное отображение, а В; — некоторая матрица ли- 
нейного преобразования в К,„. С обозначениями 
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$ =х@) -х0, у 2к®)- 20) — (1.25) 
соотношение секущих в Е „ обретает более короткую запись: 
В, $9 =У(0. (1.24а) 


Аналогично одномерному случаю, а именно, по аналогии с 


формулой (7.22), будем искать приближения к решению х” век- 
торного уравнения (7.1а) по формуле 


+0 = х(9 ВЕ). (1.26) 


Желая, чтобы эта формула обобщала метод секущих (5.32), обра- 
тимую ихи-матрицу Ву в ней нужно подобрать так, чтобы она 
удовлетворяла соотношению секущих (7.24). Но это соотноше- 
ние не определяет однозначно матрицу Вх: глядя на равенство 
(7.24а), легко понять, что при и>1 существует множество мат- 
риц Вх, преобразующих заданный и-мерный вектор $ в дру- 


гой заданный вектор у“ ) (отсюда — ясность в понимании того, 
что могут быть различные обобщения одномерного метода секу- 
щих, см. замечание 7.1). 

При формировании матрицы В, будем рассуждать сле- 
дующим образом. 

Переходя от имеющейся в точке х 
функции Ё(х) 


5 аффинной модели 
Фи = Е(10)+В, 1-х) (1.27) 

к такой же модели в точке х(Ю 
Ф.=Ек®)+ в, (х-х(0), (1.28) 


мы не имеем о матрице линейного преобразования В; никаких 
сведений, кроме соотношения секущих (7.24). Поэтому исходим 
из того, что при этом переходе изменения в модели должны быть 
минимальными. Эти изменения характеризует разность 
Ф, -Ф, 1. Вычтем из равенства (7.28) определяющее Ф,_| ра- 
венство (7.27) и преобразуем результат, привлекая соотношение 
секущих (7.24). Имеем: 


Ф;-Ф1=2(®)- 29) В, к-х®)- В, 1(к-х 0) = 
= В, («@ -х#3)- Вх +в: ко + (Вх —В ух = 


= (В: -Вь 1-х). 
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Представим вектор х— х( 1 


сированного вектора $), определенного в (7.25), и некоторого 
вектора &, ему ортогонального: 


хх оз Ю +, аЕВЕ, 1Е К): (654) =0. 


в виде линейной комбинации фик- 


Подстановкой этого представления вектора хх Ив разность 
Ф, -Ф,_| получаем другой ее вид 
Ф; Фут = а (Ву - Ву 1) +(В-В р. = (1.29) 


Анализируя выражение (7.29), замечаем, что первое слагае- 
мое в нем не может быть изменено, поскольку 


(Ве -Вь 18 = Вуз — Вы в = — В 8 


— фиксированный вектор при фиксированном К. Поэтому ми- 
нимальному изменению аффинной модели Ф,_| будет отвечать 
случай, когда второе слагаемое в (7.29) будет нуль-вектором при 
всяких векторах &, ортогональных векторам $(®), т.е. В к следует 
находить из условия 


(В. -Вь 1) =0 У: (650)=0. (1.30) 


Непосредственной проверкой убеждаемся, что условие (7.30) бу- 
дет выполнено, если матричную поправку Ву — Ву_1 взять в виде 
одноранговой их и-матрицы 


А Ю) (6 )" 
О-В в )6 0) 
п" 
6) 5® 

Таким образом, приходим к так называемой формуле пересчета 
С. Бройдена (1965 г.) 

Г: юг 

( 1 ВЕ ›) (< ›) 


66 5 


В; Ву = 


Вова (1.31) 


которая позволяет простыми вычислениями перейти от старой 
матрицы В,_| к новой В, такой, чтобы выполнялось соотноше- 
ние секущих (7.24а) в новой точке и при этом изменения в аф- 
финной модели (7.27) были минимальны (строго доказано [68], 
что такое построение отвечает минимальности поправки 
В; - В; по норме Фробениуса на множестве матриц Вх, удов- 
летворяющих соотношению секущих (7.24а)). 

Совокупность формул (7.26), (7.31) вместе с обозначениями 
(7.25) называют методом секущих Бройдена или просто 


297 


методом Бройдена решения систем нелинейных числовых урав- 
) 


Е 
нений °. 
Хотя в методах секущих обычным является задание двух 


начальных векторов (х(®) и х()), для метода Бройдена характер- 
но другое начало итерационного процесса. Здесь нужно задать 


один начальный вектор х(0), начальную матрицу Ву и далее в 


цикле по К=0,1,2,й последовательно выполнять следующие 
операции: 


1. решить линейную систему 
Виз =-Р(®) (1.32) 
относительно вектора О (см. (7.26)); 


2. найти векторы х(+0 и у) (см. (7.25)): 
3. сделать проверку на останов (например, с помощью 
проверки на малость величин [9] и/или ор и, 


если нужная точность не достигнута, вычислить но- 
вую матрицу В; по формуле пересчета (см. (7.31) 


(ео - в, 0) 6+0) | 


Ве = Вх н- 
уе 
6+0) $ (+0 


(1.34) 


В качестве матрицы Во, требуемой равенством (7.32) для 
запуска итерационного процесса Бройдена, чаще всего берут 
матрицу Якоби Е'(х 0) или какую-нибудь ее аппроксимацию. 
При этом, как отмечается в [68], получаемые далее пересчетом 
(7.34) матрицы В1, Во, й не всегда можно считать близкими к 
соответствующим матрицам Якоби Е к), Е '«2)), й (что 
может иногда сыграть полезную роль при вырождении матриц 
Ех" ). Но, в то же время, показывается, что при определенных 
требованиях к матрицам Якоби Е’(х) матрицы Ву; обладают 
«свойством ограниченного ухудшения», означающим, что если и 


* 
) Имеются также различные варианты метода Бройдена, успешно 
применяемые к задачам безусловной оптимизации. 
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происходит увеличение | -Е(®] с увеличением номера 

итерации А, то достаточно медленно. С помощью этого свойства 
> < 'а * 

доказываются утверждения о линейной сходимости («@®) кх 


при достаточной близости х©0) кх’и Во к Ех ©), а в тех 


предположениях, при которых можно доказать квадратичную 
сходимость метода Ньютона (7.6), — о сверхлинейной сходимо- 
сти последовательности приближений по методу Бройдена. 

Как и в случаях применения других методов решения нели- 
нейных систем, проверка выполнимости каких-то условий схо- 
димости итерационного процесса Бройдена весьма затрудни- 
тельна и обычно заменяется проверками на выполнимость нера- 
венств типа (7.16). 


Формуле пересчета (7.34) в итерационном процессе Брой- 


дена можно придать чуть более простой вид. 
Так как, в силу (7.32) и (7.33), 


у ве и Е) Е) Е®)= Е), 
(6+0)! @0 = 6+7, $40) = -=@|,, 


то из формулы (7.34) получаем формально эквивалентную ей 
формулу пересчета 


(к) _ х@) 


Ву = В; + т 
к 


(1.35) 


которую можно использовать вместо (7.34) в совокупности с 
формулой (7.26) или с (7.32), (7.33) (без вычисления вектора 
у 5, Такое преобразование итерационного процесса Бройдена 
несколько сокращает объем вычислений (на одно матрично- 
векторное умножение на каждой итерации). Не следует, правда, 
забывать, что при замене формулы (7.34) формулой (7.35) может 
измениться ситуация с вычислительной устойчивостью метода; к 
счастью, это случается здесь крайне редко, а именно, в тех слу- 
чаях, когда для получения решения с нужной точностью требует- 
ся много итераций по методу Бройдена, т.е. когда и применять 
его не стоит. 
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7.5. ОБОБЩЕНИЕ ПОЛЮСНОГО МЕТОДА 
НЬЮТОНА НА МНОГОМЕРНЫЙ СЛУЧАЙ 


В предыдущем параграфе при выводе метода секущих 
Бройдена решения систем нелинейных уравнений вида (7.1) мы 
возвращались к одномерной задаче (7.20) и рассматривали ин- 
терпретацию метода секущих, отличную от данной ранее в $ 5.6. 
Поступим аналогично и здесь, переложив вывод одномерного 
полюсного метода Ньютона (5.36) на векторную основу. Будем 
при этом руководствоваться теми же, что ив $ 5.7, геометриче- 
скими соображениями, опирающимися на рис. 5.12, и пользо- 
ваться теми же обозначениями. 

Касательную к кривой у= /(х) в точке (ху; /(хь)) 
зададим условием ортогональности текущего вектора”) 
и = (ххх; у- Лк )) этой прямой и ее нормального вектора, в 
качестве которого можно взять вектор п := (/’(хь); -П). Уравне- 
ние прямой, проходящей через полюс Р(с; 4) и связанную с уже 
известным приближением х; точку (ху; 0), получим из условия 
коллинеарности текущего вектора этой прямой у := (х-ху; у) и 
ее направляющего вектора 1:= (с-х,; а). Таким образом, точку 


пересечения двух прямых, проекцию которой на ось абсцисс 
считаем новым приближением Хк+1› Находим из совокупности 


условий 


и1п, У|1. (7.36) 
Первое из этих условий означает равенство нулю скалярного 
произведения (п, и), второе — пропорциональность соответст- 


вующих координат векторов у и | или, иначе, равенство нулю 
составленного из них определителя. Следовательно, искомое 
приближение Хк-1 есть первая компонента вектора, служащего 


решением линейной системы 


Ге@е-х)-у+Л@,)=0, 


хм У (1.37) 
СХ [и Ю 
(вторая компонента — ордината точки пересечения указанных 


прямых — после вычисления значения Я@ может дать ин- 


Е 
) Не будем здесь различать двумерные векторы-строки и векторы- 
столбцы. 
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формацию об отклонении от функции Х(х) в точке х,.1 ее 
локальной аффинной модели, каковой является проведенная в 
точке х, касательная). Ясно, что получаемое из системы (7.37) 
значение х:=х,.| тождественно его выражению по формуле 
(5.36). 

Рассмотренный векторный подход к построению одномер- 
ного полюсного метода Ньютона служит ключом для его распро- 
странения на двумерный случай на основе таких же геометриче- 
ских, но уже пространственных соображений. 

Пусть требуется найти приближенное решение двумерной 
нелинейной системы (7.17) в предположении непрерывной диф- 
ференцируемости входящих в нее функций /(х, у) и &(х, у) в 
некоторой области С, содержащей искомое решение 
х = х; У и приближения к нему х(®) = (<; У, 
Е =ОЬ2й . 

Будем считать, что уже найдено А-е приближение к реше- 
нию х” и нужно получить правило перехода к (к +1)-му при- 
ближению. В сделанном предположении о гладкости функций 
У (х, у) и а(х, у) можно провести касательные плоскости в точке 
(хр; ук; 0) к определяемым ими поверхностям 


=Дыу) и вар У). (7.38) 
Эти плоскости задаются текущими векторами 
еб. тЫ, 
ея, -9,:-86®, 
и нормалями 
ао, у Л.Ю), 


но (5, У 5, уЮ).-1 


соответственно, т.е. аналогично первому из условий (7.36) долж- 
но быть п; ГУ], во [ У2, иначе, 


(пу!) =0, (п>, у) =0. (7.39) 


Пересечение двух касательных плоскостей, т.е. образ, опре- 
деляемый уравнениями (7.39), есть прямая в трехмерном про- 
странстве, общая точка которой с координатной плоскостью Оху 


(К-+1) 


> * 
является ньютоновским приближением х к решению х сис- 
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темы (7.17). Наша цель — построить третью плоскость, пересе- 
чение которой с упомянутой прямой (линией пересечения каса- 
тельных плоскостей ) давало бы точку в пространстве В; такую, 


проекция которой на плоскость Оху могла бы оказаться ближе к 
* = 
х , чем хе. 

Чтобы осуществить поставленную цель, зафиксируем в К; 
две несовпадающие между собой и с К; у; 0) точки — 
полюсы Р(а; ; 4) и Р>(а>; 5>; 4). Через указанные три точ- 
ки К, Р, Р› можно провести единственную плоскость (которая 
здесь играет роль прямой, проходящей через полюс и точку 
(хх; 0) в одномерной ситуации). Взяв текущую точку М(х; у; 2) 

— 
и образовав текущий вектор уз = КМ этой третьей плоскости, 
—ь 
можно задать ее условием компланарности трех векторов: КВ, 
— - 
КР› и КМ (что служит аналогом второго из условий (7.36)). 

Запишем совокупность всех трех описанных средствами 

векторной алгебры плоскостей в координатной форме. Имеем: 


29, у®) к) 6, ую) )-:+ о, У®)-0, 


2 (к. У) (:-х®)+ =, (х®, 70)(›-у®)-2+8(®, У®)=0, 

р Зе 

Ч] _х® Ь —у® Ч =. 

а _ х® Ь> —у® 4> 


Первые две координаты вектора (х; у; 2), служащего реше- 


нием полученной системы уравнений, считаем искомым прибли- 
(К-+1). ый 
‚У 


(© — х +0 _ х®, 49 = у+0 у, (7.40) 


жением ( . Введя поправки 


Р 
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эту систему превращаем в систему уравнений относительно 


неизвестных р®, а® И 2: 


(к ®, У®)р® +1. ®, 7®)а® -2=—-Кх®, У®), 


50 У) о Юа--®, у), 


(7.41) 
ПЕ 
Ч] _х® [и _у® а =0. 


а _ х® Ь> _-у® 4 


2 


Для исключения вспомогательной переменной 2 из линей- 
ной системы (7.41) выразим ее из третьего уравнения. Обозначив 


ФВ -79 а ю_ |а-х9 а 
А® = м и. 
Ь> =у 4 а -х 4 
[4 К 
А = |9 -2” И ‚ 5 
р 


раскрываем фигурирующий в (7.41) определитель по элементам 
первой строки: 


А р + 9 +: 50. 


р 
Отсюда находим выражение 
А 0.49) 
=в=—— + Я” (7.43) 
А® А) 


подставляя которое в первые два уравнения системы (7.41), при- 
ходим к двумерной линейной системе 


ю в\_4] ю и &\ в 
АЕ ‚У )- Р + о ‚У - Ч —- 
__ (9% 
=“ , , 
Ик, (1.44) 
(К) (К) 8 (К) (К) (К) д (К) 
2 ‚У )- Р те =. ‚У 5 Ч == 
в, 6). 
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Фактически эта система вместе с обозначениями (7.42) и определя- 
ет двумерный полюсный метод Ньютона для нелинейной систе- 


мы (7.17). Найдя из нее поправки р®, а, в соответствии с ра- 


венствами (7.40) получаем очередное приближение х(“ТО: 
(НО — :(®) +р®, у@+) м у® +4. 


Дальнейшее обобщение полюсного метода Ньютона, т.е. 
переход от размерности 2 к произвольной размерности и > 2, со- 
вершаем формально на основе предыдущего построения. 

Пусть задана нелинейная система (7.1), функции },(х) в ко- 
торой считаем достаточно гладкими. Совокупность всех «каса- 
тельных гиперплоскостей» к гиперповерхностям, определяемым 
данными функциями /;(х) (образующими вектор Е(х)ЕВ,) в 


точке х(9 КБ, можно описать векторно-матричным уравнением 
Ех) -х@®)-х =-Е (<), (7.45) 
ГДЕ ЖЕ Хи $ вах — и-мерный вектор, каждой 


компонентой которого служит вспомогательная переменная 
Х„+1, Входящая в уравнения гиперповерхностей х„.1 = /;(х) 
(ср. с (7.38)). 

Зададим и полюсов Р.(сд; сруй ; си; а;) (=ЬЗ,Й ‚п) 
так, чтобы они не принадлежали одной гиперплоскости про- 


странства В,.|. Через все эти полюсы РВ и точку 


(-®; 2" й х(; 0), определяемую известным приближением 
х(0 к решению системы (7.1), проводим гиперплоскость, урав- 


нение которой аналогично двумерному случаю задаем условием 
равенства нулю определителя (и +1)-го порядка: 


А к к 
м хх `# х,-ж ) Хи+1 
ю) й К 
[1] = С12 - $ Сп 2 Ч =0. (7.46) 
6 ( 6 ( ( 
Г: р: К 
ст-ж) си 2 а 


Векторно-матричное уравнение (7.45) и скалярное уравнение 
(7.46), в принципе, уже определяют и-полюсный метод Ньютона 
для построения приближений к решению системы (7.1). Чтобы 
записать соответствующую линейную систему относительно 
поправок 
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Г А+! | 
и фай 


р =| с У 5 = Г) (7.47) 
К +1 К 
ро ее 50 
(аналогичную системе (7.44) двумерного случая), введем сле- 
дующие обозначения. Положим 


си @ Сы и 

С — [ [1 6 ‚9 = + Й 
Си й Сип Ч 

Уй , 

(о) хи) [ х(Ю 


= =| # ( 6 
о} х(®) ( х(® 


и образуем квадратную (и+1)-мерную матрицу следующей 


структуры: 
К К 
= р ) р Хи-+1 
9, = 
с-Х, а 
Тогда на основе (7.45), (7.46) имеем (п-+1)-мерную систему 
уравнений относительно неизвестных р ый р, ИЕ 


К) ео 
| ( )ь 7 Е( у (1.48) 
Че о, —=0-. 
Как и в двумерном случае, из второго уравнения этой системы 
выражаем вспомогательную неизвестную х„+1: 
Т_х- (0 &) 
хня ор Ха)’ Ру°, (7.49) 
= 

где А := (-1)” 4её (С-Х,), а а(®) есть алгебраические допол- 


4 
нения к элементам ро ) первой строки матрицы О’ (что через 


соответствующие миноры Му; этой матрицы можно представить 


Х, = 


так: 


А 1+1 : 
а? =(-0"/ му, 1=Ь2 ‚п). 
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Заменив в (7.48) все компоненты вектора # найденным их значе- 
нием (7.49), приходим к следующему линейному векторно- 
матричному уравнению относительно вектора-поправки р) : 


[+ А, р® =-2 (0), (1.50) 
где 
10” а а 
ей 4 Й | 7.51 
"` ее -хы бэ 


а® ( а(® 
Уравнение (7.50) вместе со связью (7.47), согласно которой 
хо) = 0 +, (1.52) 


является неявной формой и-полюсного метода Ньютона для 
уравнения (7.1а). 
Совокупности формул (7.50)—(7.52) можно придать другой 


ВИД: 
хе хо [+ д, |1 Ех), (1.53) 


который удобно трактовать как явный метод Ньютона со своеоб- 
разной коррекцией матриц Якоби путем прибавления к ним фор- 
мирующихся по заданному правилу матриц Ах. Как и в одно- 
мерном случае, для ускорения сходимости последовательности 
приближений х() полюсы Р. целесообразно изменять в такт с 
изменением значений функций, и в самом простом случае есть 
смысл фиксировать матрицу С, а вектор 4 (= а“ )) брать равным 


Е) или — Е | 


Замечание 7.3. Обобщение полюсного метода секущих (5.37) на 
многомерный случай, как и обычного метода секущих (5.32) (0 чем уже не 
единожды упоминалось), может иметь много вариаций. Одним из плодо- 
творных подходов к такому обобщению является использование здесь 
рассмотренных в предыдущем параграфе формул пересчета Бройдена. 


7.6. О РЕШЕНИИ НЕЛИНЕЙНЫХ СИСТЕМ 
МЕТОДАМИ СПУСКА 


Общий недостаток всех рассмотренных выше методов ре- 
шения систем нелинейных уравнений — это сугубо локальный 
характер сходимости, затрудняющий их применение в случаях 
(довольно типичных), когда имеются проблемы с выбором хо- 
роших начальных приближений. Помощь здесь может прийти со 
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стороны численных методов оптимизации — ветви вычисли- 
тельной математики, обычно выделяемой в самостоятельную 
дисциплину. Для этого нужно поставить задачу нахождения ре- 
шений данной нелинейной системы как оптимизационную или, 
иначе, экстремальную задачу. Ради геометрической интерпрета- 
ции проводимых ниже рассуждений и их результатов, ограни- 
чимся, как ив $ 7.3, рассмотрением системы, состоящей из двух 
уравнений с двумя неизвестными, т.е. системы (7.17). 
Из функций Г и < системы (7.17) образуем новую функцию 


2 2 
Ф(х, у) = Г (х, у)+ &^(, у). (7.54) 
Так как эта функция неотрицательна, то найдется точка”) 


* * 
(: ; у } такая, что 


(=>) >Ф(х",у')>0 У (х; у) Е В, 


* * & 
т.е. (* ;у ) = аге ти Ф(х, у). Следовательно, если тем или 
хеВ, 


* * 
иным способом удается получить точку ( ; у Й минимизирую- 
щую функцию Ф(х,у), и если при этом окажется, что 


| Е ФУ) =Ф(х, у) =0, то (“"; у”) — искомое решение 
х, у)ЕВ, 
системы (7.17), поскольку 


* * 
( ‚У )= 0, 

* * 
8 ‚У ]=0. 
Последовательность точек (ху; Ук) — приближений к точке 


(=; И) минимума Ф(х, у) — обычно получают по рекуррент- 
ной формуле 


Ф(»", у')= 0 <> 


х Ху Я 
| ка | в=02 Я , (1.55) 
Ук Ук ЧА 
где (ре; @х у — вектор, определяющий направление 
минимизации, а &, — скалярная величина, характеризующая 


величину шага минимизации (шаговый множитель). Учитывая 
геометрический смысл задачи минимизации функции двух пере- 
менных Ф(х, у) — «спуск на дно» поверхности 2 = Ф(х, у) 


* 
) Вообще говоря, не единственная. 
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(см. рис. 7.1), итерационный метод (7.55) можно назвать мето- 
дом спуска, если вектор (рр; ах )” при каждом К является на- 
правлением спуска (т.е. существует @>0 такое, что 
Ф(х, +а ру, ур +аак)<Ф(ху, ур) и если множитель @; под- 
бирается так, чтобы выполнялось условие релаксации 
Ф(ху-1, Уд) < Ф(хь, ур), означающее переход на каждой ите- 
рации в точку с меньшим значением минимизируемой функции. 


Итак, при построении численного метода вида (7.55) мини- 
мизации функции Ф(х, у) следует ответить на два главных во- 


проса: как выбирать направление спуска (ру, 4х у и как регули- 
ровать длину шага в выбранном направлении с помощью скаляр- 
ного параметра — шагового множителя @;. Приведем наиболее 
простые соображения по этому поводу. 


При выборе направления спуска естественным является вы- 
бор такого направления, в котором минимизируемая функция 
убывает наиболее быстро. Как известно из математического ана- 
лиза функций нескольких переменных, направление наибольше- 
го возрастания функции в данной точке показывает ее градиент в 
этой точке. Поэтому примем за направление спуска вектор 


ы Фу (хк, ук) 


= -2тад Ф(х,, ур) =-| , 
Ч бы Ф',(хк, Ук) 


— антиградиент функции Ф_(х, у). Таким образом, из семейства 
методов (7.55) выделяем градиентный метод 


Хр+1 Хх Фу (хь, Ук) 
= -@а |, у (7.56) 
У У Ф',(хь, Ук) 
Оптимальный шаг в направлении антиградиента — это та- 
кой шаг, при котором значение Ф(ху+1, Уд-1) — наименьшее 


среди всех других значений Ф(х, у) в этом фиксированном на- 
правлении, т.е. когда точка (ху; Уд+1) является точкой условно- 


го минимума. Следовательно, можно рассчитывать на наиболее 
быструю сходимость метода (7.56), если полагать в нем 


а; = аге ти Фо -аФ, (хр, Ук), Ук -а Фу (ду, ук). (1.57) 
[24 


Такой выбор шагового множителя, называемый исчерпывающим 
спуском, вместе с формулой (7.56) определяет метод наиско- 
рейшего спуска. 
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Геометрическая интерпретация этого метода хорошо видна 
из рис. 7.1, 7.2. Характерны девяностоградусные изломы траек- 
тории наискорейшего спуска, что объясняется исчерпываемо- 
стью спуска и свойством градиента (а значит, и антиградиента) 
быть перпендикулярным к касательной к линии уровня в соот- 

Е 


ветствующей точке 


(ХЕ; Ук) 
стад Ф(хх, ук) 


и 


* 
‚У ) 
(Хр; Ук) 


Рис. 7.1. Пространственная интер- Рис. 7.2. Траектория наискорей- 
претация метода наискорейшего шего спуска для функции (7.54) 
спуска для функции (7.54) 


Наиболее типичной является ситуация, когда найти точно 
(аналитическими методами) оптимальное значение @, не удает- 
ся. Следовательно, приходится делать ставку на применение ка- 
ких-либо численных методов одномерной минимизации и нахо- 
дить ах в (7.57) лишь приближенно. 

Несмотря на то, что задача нахождения минимума функции од- 
ной переменной фу () = Ф(х; а Ф,(хь, ук), ур -@Ф, (к, У) 
намного проще, чем решаемая задача, применение тех или иных 
численных методов нахождения значений &@/ = аго т фу (&) с 
той или иной точностью требует вычисления нескольких значе- 


ЕЗ 
) Представив образно процесс движения текущей точки по траек- 
тории наискорейшего спуска на участке от положения (хр; ук) до 


(ха; Ук), можно отметить, что спуск характеризуется пересечением 
линий уровня Ф(х, у) =с все с меньшими значениями с до тех пор, пока 


не произойдет касание некоторой линии уровня (сплошь заполняющих 
0(Ф)); дальнейшее движение в этом направлении приведет к пересечению 


линий уровня Ф(х, у) = с с увеличивающимися значениями параметра с. 
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ний минимизируемой функции. Так как это нужно делать на ка- 
ждом итерационном шаге, то при большом числе шагов реализа- 
ция метода наискорейшего спуска в чистом виде является доста- 
точно высокозатратной. Существуют эффективные схемы при- 
ближенного вычисления квазиоптимальных @„ , в которых учиты- 


вается специфика минимизируемых функций (типа сумм квадратов 
функций) [61]. 

Зачастую успешной является такая стратегия градиентного 
метода, при которой шаговый множитель @ в (7.56) берется ли- 


бо сразу достаточно малым постоянным, либо предусматривается 
его уменьшение, например, делением пополам для удовлетворе- 
ния условию релаксации на очередном шаге. Хотя каждый от- 
дельный шаг градиентного метода при этом, вообще говоря, да- 
лек от оптимального, такой процесс по количеству вычислений 
функции может оказаться более эффективным, чем метод наис- 
корейшего спуска. 

Главное достоинство градиентных методов решения нели- 
нейных систем — глобальная сходимость. Нетрудно доказать, 
что процесс градиентного спуска приведет к какой-либо точке 
минимума функции из любой начальной точки. При 
определенных условиях найденная точка минимума будет иско- 
мым решением исходной нелинейной системы. 

Главный недостаток — медленная сходимость. Доказано, 
что сходимость таких методов — лишь линейная, причем, если 
для многих методов, таких как метод Ньютона, характерно уско- 
рение сходимости при приближении к решению, то здесь имеет 
место скорее обратное. Поэтому есть резон в построении гиб- 
ридных алгоритмов, которые начинали бы поиск искомой точки 
—щ решения данной нелинейной системы — глобально сходя- 
щимся градиентным методом, а затем производили уточнение 
каким-то быстросходящимся методом, например, методом Нью- 
тона (разумеется, если данные функции обладают нужными 
свойствами). 

Разработан ряд методов решения экстремальных задач, ко- 
торые соединяют в себе низкую требовательность к выбору на- 
чальной точки и высокую скорость сходимости. К таким мето- 
дам, называемым квазиньютоновскими, можно отнести, напри- 
мер, метод переменной метрики (Дэвидона-Флетчера-Пауэл- 
ла), симметричный и положительно определенный методы 
секущих (на основе формулы пересчета Бройдена, см. $ 7.4), а 
также уже упоминавшийся ранее применительно к СЛАУ (см. гл. 
3) метод сопряженных градиентов. 
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При наличии негладких функций в решаемой задаче следует 
отказаться от использования производных или их аппроксимаций 
и прибегнуть к так называемым методам прямого поиска (цикли- 
ческого покоординатного спуска, Хука и Дживса, Розенброка 
и т.п.). Описание упомянутых и многих других методов такого 
типа можно найти в учебной и в специальной литературе, посвя- 
щенной решению экстремальных задач (см., например, [32, 49, 
52, 68, 108]. 


Замечание 7.4. Для разных семейств численных методов миними- 
зации могут быть рекомендованы свои критерии останова итерационного 
процесса. Например, учитывая, что в точке минимума дифференцируемой 
функции должно выполняться необходимое условие экстремума, на конец 
счета градиентным методом можно выходить, когда станет достаточно 
малой норма градиента. Если же принять во внимание, что минимизация 
применяется к решению нелинейной системы, то целесообразно отслежи- 
вать близость к нулю значений минимизируемой неотрицательной функ- 
ции Ф(х, у), т.е. судить о точности получаемого приближения по квадрату 


его евклидовой нормы невязки. 


Замечание 7.5. Как отмечалось в начале этого параграфа, ограниче- 
ние размерности решаемой системы здесь делалось сугубо из иллюстра- 
тивных соображений. Ничто не помешает развить рассматриваемый под- 
ход на случай п-мерной системы (7.1), сводя ее решение к экстремальной 
задаче 


Ф(х) = у 12 (х) > шт. 
1=1 


7.7. ЧИСЛЕННЫЙ ПРИМЕР 


Типичное поведение рассмотренных методов решения сис- 
тем нелинейных уравнений отражает следующий численный 
пример. 

Пусть ищется решение системы 

Ее =, 
20$11(0.7х- 0.7у)+7х+7у=0 
в окрестности точки хо =0, уд =-1. 

Результаты применения к этой системе разных описанных 
выше итерационных процессов, начинающихся с данной точки 
(хо; Уд) изаканчивающихся, как только выполнится неравенство 


(1.58) 


тах{хк — хк-1|› [Уд — Ук} <=, (7.59) 


где К — номер итерации, представлены в таблице 7.1. В ней при- 
ведены: приближенные решения, полученные на А-й итерации с 


ЗИ 


помощью девяти перечисленных там методов, значения А, при 
которых сработал критерий (7.59) с = = 0.000001, а также векто- 
ры невязок, характеризующие некоторую меру близости указан- 
ного приближения к точному решению системы (7.58). При этом 
всюду шаг аппроксимации производных (начальный шаг в мето- 
дах секущих и Брауна) брался равным = в каждой компоненте. 
Таблица 7.1 
Результаты решения системы (7.58) разными методами 


Приближен- Число Н 
евязка 
ное рЕение итераций ‘а а 0 
(хк; хр) 3%); 8%, у)" 


—0.46584782 0.000000000001 
—1.67846886 Е —0.000000000002 
Разностный —0.46584782 —0.000000000497 
Ньютона —1.67846886 —0.000000000261 
Простейший —0.46584782 5 0.000000000001 
секущих —1.67846886 —0.000000000002 
о аппрок” | |) 46584782 4 0.000000000098 
обратных матриц |-167846886 —0.000000000048 
Б 
5 | Саппронеимашией —0.46584782 —0.000000000000 
—1.67846886 —0.000000037367 
производных) ) 


Полюсный Е 4 | | 0000000000000 
Реоиа” к. Е 4 | | 0000000000000 


Секущих —0.46584781 0.000000100053 
Бройдена —1.67846886 0.000000040792 
Модифицирован- | (46534784 —0.000001418985 
ный (упрощенный) | т’ И. 
Е 1.67846880 0.000000589060 
Наискорейшего —0.46584667 36 —0.000012735642 
спуска —1.67846711 0.000014735135 
Число итераций и, соответственно, число нулей перед пер- 
выми значащими цифрами в невязках, подкрепляет сделанные 
выше заявления о быстрой сходимости методов 1-7 и справедли- 


вость высказанных в замечании 7.2 соображений о надежности и 
даже некоторой грубости простого критерия останова (7.16) (для 


* 
) Аппроксимация производных на К-й итерации осуществлялась с 
шагом Их = ти |9} 


2 
ши. С постоянной матрицей С:= [; г] и переменным вектором 


9:= Е), т.е. с полюсами Р® = (1;2; У(хь, ук), Р® = (2; 0; 2(хь, ук)). 
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системы (7.58) реализованного в виде (7.59)). Сравнивая шестые 
знаки после запятой у приближенных решений, полученных ме- 
тодом наискорейшего спуска и, например, методом Ньютона, 
видим, что для медленно сходящихся методов примененный кри- 
терий уже не является столь надежным (из процесса итерирова- 
ния в градиентных методах, как уже упоминалось в замечании 
7.4, обычно выходят по своим критериям, например, по малости 
нормы градиента). 


7.8. СХОДИМОСТЬ МЕТОДА НЬЮТОНА _ 
И НЕКОТОРЫХ ЕГО МОДИФИКАЦИИ 


Многие утверждения о сходимости метода Ньютона восхо- 


дят к известным результатам Л.В. Канторовича ), перенесшего 
метод Ньютона на нелинейные операторные уравнения в банахо- 
вых пространствах, в связи с чем и метод в таком общем случае 
часто называют методом Ньютона-—Канторовича. В основе 
этих результатов лежит принцип мажорирования операторного 
уравнения некоторым скалярным уравнением, через корни кото- 
рого оценивается абсолютная погрешность приближений, полу- 
чаемых в итерационном процессе (см. [80, 129] и др.). Таким пу- 
тем получают условия квадратичной сходимости основного (7.6) 
и линейной сходимости модифицированного (упрощенного) (7.8) 
методов Ньютона. Непосредственное применение подобной ме- 
тодики к анализу сходимости методов более общего вида, в част- 
ности, ААМН (7.11), затруднительно. Поэтому изберем другой 
путь исследования сходимости итерационных последовательно- 
стей. Вообще говоря, здесь будет эксплуатироваться та же идея 
скалярного мажорирования, только в несколько ином виде. 
Прежде всего, попытаемся выяснить, какие условия нужно 
наложить на скалярную последовательность (р»), мажорирую- 


щую последовательности норм поправок х(+1 — х) и невязок 
Ех (9 ‚ чтобы последовательность и-мерных векторов х(® схо- 
дилась к нулю вектор-функции Е(х) с заданным порядком 
и (21 скорости сходимости независимо от способа получения 


элементов последовательности («© ) 


г. Канторович Леонид Витальевич (1912—1986) — российский ака- 
демик, приобретший мировую известность своими основополагающими 
работами в области линейного программирования и применения функ- 
ционального анализа в вычислительной математике. 
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Теорема 7.3. 1. Пусть непрерывная векторная 
* 
функция Е МсВ, >В, ) и последовательность векто- 


ров хЕМ таковы, что при всех К е № выполняются ус- 
лов 


ия: 
+1 А : Г: 
краз 2) 8), 
где числа ру определяются рекуррентным равенством 
Вел =, ВОЗ , (7.60) 
ай>0, Су>0, ро >0 и и>1 — некоторые числовые па- 
раметры. 
П. Тогда, если у=Со 2 ЗЕ и замкнутый шар 
и 
(0) т, 
8, ед содержится в М ‚, то все члены 
1=0 
последовательности («) принадлежат 5, последова- 
тельность (о) имеет предел хе 5 такой, что 


Е “= 0; ири этом быстрота сходимости (©) кх ха- 
рактеризуется неравенством (УК е М) 


ии 
* с 
х к < я Г. (1.61) 
1-й 
Доказательство. Пользуясь равенством (7.60), выра- 
зим элементы последовательности (р;) через ее начальный член 


ро и определенную в теореме величину у: 


1 2 1 2 3 
р: = борЁ = боборе, = ОН ре = ОНИ ре = = 


ры 
1 


— 


и- и 


а В и 
— 0 29 =50 "720 `В “80 2А , 


* 
) Без всяких прочих изменений можно заменить здесь В, -> В, на 


более общий случай В, > В,. 
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Следовательно, условие 1) доказываемой теоремы можно пере- 
писать в виде 
и'-1 
[Ох 5 дроу ит. (1.62) 
Посредством (7.62) теперь устанавливаем, что 
д’ 


о У 56] = дроу <, 
1=0 1=0 


т.е. все члены заданной последовательности (®) принадлежат 
5< М. Покажем, что она удовлетворяет критерию Коши. С по- 
мощью того же неравенства (7.62) имеем: 
1 
д-— 


ен _ Фо р -6]< № $ ии = 
= |= 


и 
А А К+1 К К К+т-1 
= Дро-и 1 (1+5 ый 8 В зу )< 


шеф дА- А 
И и а И.А де 1" 
<Ро:и чи” чи +Й +и = ИРо:и . т 
1-иё 
Полученное неравенство, рассматриваемое при финоированном 
тЕМик-> о, говорит о фундаментальности х(9) и существо- 
* 
вании предельного вектора х в шаре 5 (в силу предполагаемой 
замкнутости 5). С другой стороны, если в нем зафиксировать А 
и перейти к пределу при т —> ©, сразу получается утверждаемая 
и“ 
оценка (7.61). Подстановка выражения р; = Ро" #1 в условие 
2) показывает, что [26+] —0 при АК->® (т.е. при 
- * 
хх ), а это, в силу предполагаемой непрерывности ЁЕ(х), 


* . 
означает, что х := Пт х(®) есть решение уравнения Ё(х)=0. 
К—>о 
Теорема доказана. 


Замечание 7.6. Нетрудно убедиться, что теорема 7.3 (а также сле- 
дующая теорема 7.4) справедлива и при д =1. При этом 
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ми 
[= 


и"У=0(, г= .и 
1-и 


* 
(т.е. сходимость («®) к х вшаре 5 ©, „) в этом случае — линейная). 


Изменим требования к последовательности (( )) и к вектор- 
функции Р(х), фигурирующие в части 1 теоремы 7.3, так, чтобы осталась 
неизменной ее констатирующая часть П. 


Теорема 7.4. Пусть существуют такие последова- 
тельности положительных чисел Ну и Су, удовлетво- 


ряющих условиям Ну <Но, Су <Оф, и число и>1, что в 


предположении, что х ЭЕМ ‚ при всех К е № у выполняют- 
ся неравенства: 


оке, Е 
2) |“ (=>) ] 26) 2) 


Тогда справедлива часть И теоремы 7.3 с ро >|Е ©}, 
#:= Но. 


Доказательство. Определим последовательность (р; } 
равенством ру.1=С0 р и по 6 покажем, что эта после- 
довательность мажорирует (Е “ ›) | одновременно с доказа- 
тельством принадлежности векторов х(%) шару 5 (0 )» 

По условию х0) еб и В (©) }|= Ро. Сделаем индукцион- 
ное предположение, что 

хЙ еб и [6] <р; \е{0,1,й ‚№. 
Тогда 
и 
| -х@ <Н; <<] < Нор; =Норо:"^!. 


Из этого следует (см. доказательство теоремы 7.3) неравенство 
| У = кр, означающее, что х(+ еб < М. Таким обра- 
зом, значение Е ( о о) существует и 


[26] <Су [2] = Сор = РЕ. 
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Теперь можно сказать, что условия теоремы 7.3 полностью 
выполнены, значит справедливо и ее заключение. 


Прежде чем применить доказанные выше теоремы к кон- 
* 
кретным методам типа (7.5), выведем из формулы Тейлора ) 


Е(х) = Е © 4 ь)= Ехо) Е ©) > "(© )ы2 
+й Ро) наф) (1.63) 


с остаточным членом 
@(х®, в) = т! | ЕО (в (1.64) 


простое неравенство для оценивания ||Е(х)] в произвольной точ- 
ке хе М через значения ГР и ЕЁ” в близкой к х точке х`’ЕМ. 


Лемма 7.2. Пусть векторная функция Е(х) в области 
М < В, дифференцируема по Фреше и ее производная 
удовлетворяет условию Липшица: 


1 (х)- Е (0) = 2 |- к Ух, х0 Е М. 
Тогда при любых х, х(9) из м 


[Е] < [2 (© 2 (0) х©) | + =|- хо. (7.65) 


Доказательство. Запишем формулу Тейлора (7.63) с 
остаточным членом (7.64) для вр 1 = 


Е(х) = Ех® )+ | ГЕ’(в)ае. 
х (©) 


х 

Учитывая, что 17б® == ® х-х(©)), ее можно преоб- 
0 

разовать к виду 


ЕС) = Е ®)+ Ех ©) хх(0)). Ее)- Ех (0) ЧЕ. 
(0) 


х 


* а и 
) Выражения типа К О’ следует понимать как результат примене- 


ния /-линейного оператора /-кратного дифференцирования К к вектору 
в. 
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В последнем представлении ЁР(х) интеграл по отрезку к, х 


заменой #=х(® + г(х = х(® ) 
переменной ге [0, 1]. Имеем: 


Е) = Е ®)}+ кк) -х ©) 
ео 4 (к-х®))- г) «-х® и. 


Отсюда, переходя к нормам, получаем доказываемое неравенство 
(7.65), предварительно оценив норму интеграла следующим об- 
разом: 


Пек ои 


сведем к интегралу по абстрактной 


< 


< Де + 2х —х ©) | м Е © ]] . | -_ хат < 
0 


«щек оО. 


Теорема 7.5. Пусть функция Е(х) определена и диф- 
ференцируема по Фреше в некоторой открытой области 
М<К,, причем: 

1) 3250: |Е'®)-Е')|<Цк-| Ухяем;) 

2) З[Е')]изс>0 ] [2”(®)] "| <С \хЕМ. 
Тогда, если 


и:= 0.51С? ро <1, где ро> | Е], 


[2.2] 1 
- 2—1 
и замкнутый шар 5 х(0), Р:= СУ целиком содер- 
1=0 
(К) 
жится в М , то все члены последовательности \х`’}, оп- 
ределяемые методом Ньютона (7.6), начинающимся с за- 


данного х(® ‚ лежат в 5 СМ ; последовательность ( ) 


* 
) Согласно лемме 7.1, для дважды непрерывно дифференцируемой 
функции Е(х) в качестве /, можно брать оценку сверху величины |Е”(х)]. 
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* < 
имеет предел х е5, служащий решением уравнения 
Е(х) = 0; справедлива оценка погрешности 


х*— х( | г Ч 2". 
1-7 


Доказательство. Непосредственно из равенства (7.6) 
получаем 


Неси 


т.е. требование 1) теоремы 7.4с Ну =С. 
Далее обратимся к неравенству (7-65), установленному 


леммой 7.2. Положив в нем х:= (ЕН), х(0) = х ‚ приведем 
(7.65) к виду 


тЫ )] << )+ Е бе —х(® )] + 2 — 9 ||..66) 
Но в данном случае, т.е. для метода Ньютона, 


Е®)+ Ех +0 _ х@))- 0, 


поэтому 
оао ор реер. 


Таким образом, выполнено и требование 2) теоремы 7.4 с 
1 
{би =51С°, и=2. 
Завершает доказательство  подстановка постоянных 
1 
#=Но=С, С9 =51С”, и=2 в часть П теоремы 7.3. 
Для модифицированного метода Ньютона требование обра- 


тимости матрицы Якоби в любой точке М заменим менее огра- 
ничительным требованием ее обратимости лишь в начальной 


точке х(9). 
Теорема 7.6. Пусть для Е: (Мс®В,) > В,: 
ЭР"(х): (32 >0: |Е'(х)-Е')]< Их-$| УхеЕМ) УхеЕМ; 


э[®(©)]", зо >0: | [®«©)Г 


С, 
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Тогда, если при ро > [©] величина 


= [Сё ро < 0.125 (1.67) 


и замкнутый шар 5, х = содержится в 


1+1 - 81 


М ‚, то начатый с х(0) модифицированный метод Ньюто- 
ЁЗ 


на (7.8) сходится в 5 к решению х уравнения (Та) с 
оценкой погрешности 


) 


С 
х” Ре вреи 


* 1 1 
где ) У :- 2. 
2 4 


Доказательство. Как и в предыдущей теореме, требо- 
вание 1) теоремы 7.4 получается сразу же из формулы, опреде- 


ляющей метод: 
[© 6) 


К 
(&-+1) 
Для оценки |Е\х преобразуем неравенство (7.66) 
так, чтобы воспользоваться равенством нулю выражения 
Е ®)+ Ех © | _ х(® в соответствии с (7.8). Имеем: 


[ео] < («+ Е © Де -- х@))+ 


+ = («®)- к ] бы 55+ кт = 
«(о в 8 


566] 


<соЕ(к®}]. 


2 «| _ 5+1 _ х0] + _ Й] ут 


Нк]. 


=) =216». 


< гсц( +107) . 


* 
в выражениях /` и у одновременно берутся либо только верхние, 
либо только нижние знаки. 
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Отсюда видно, что можно считать выполненным требование 2) 
теоремы 7.4 с С; =Су =2ЁСог и Д=И. 

Подстановка постоянных д=1, А=Со в заключительную 
часть П теоремы 7.3 показывает (с учетом замечания 7.5), что в 
СорРо 

—и 
чая из последних двух равенств параметр ‚, получаем квадратное 
относительно у уравнение 


у? -у+21=0, 


данном случае должно быть г = ‚аи=2[Сог <1. Исклю- 


оба корня которого у; › = 0.5 0.25 —2/ положительны и мень- 


ше 1, если только неотрицателен дискриминант 0.25—21, что 
обеспечивается условием (7.67). Подставляя эти значения и, на- 
ходим связанные с ним значения радиуса г шара 5. Теперь спра- 
ведливость заключения данной теоремы очевидна. 


Обратимся, наконец, к обоснованию квадратичной сходи- 
мости метода Ньютона с последовательной аппроксимацией об- 
ратных матриц, т.е. ААМН (7.11). 


Теорема 7.7. Пусть функция Е(х) определена и диф- 
ференцируема в М < В,, причем 


36>0: |Е'(х)- Е’) < Цх-х| УххЕМ. 


Тогда, если вектор х(0) / матрица Аб таковы, что 
при некотором А > 0 выполняются неравенства 


|Е Е го] < 12 |Ео }, (1.68) 


[Ао] 
21-|Ао| 


едим, 
1=0 


то начатый с данных х(0), Ад ААМН (7.11) сходится в 5 


и= че вх ха: (1.69) 


= ие, 


к решению х уравнения Е(х) = 0 и имеет место оценка по- 
грешности 
Е ЯеЕ(“о | 
гк] ЧЕЛ. (1.10) 
ТЕ” 
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Доказательство. Введем в рассмотрение последова- 
тельности положительных величин ру, Вь,Вь, определяемых 
при А =0,1,2,й равенствами 


Рел=4142р2, р = [Е (<) | (1.70) 
Ву =21.12 рк; (1.72) 
= В, в =. (1.73) 


Очевидно невозрастание этих последовательностей. Легко также 
видеть, что 


В =ГА2 р, УКЕМ. (1.74) 


Действительно, предположив равенство (7.74) верным при неко- 
тором А, имеем 


2, \}? 2 29 2 
Бен = 14? рь} = 14? 4142 рр = Е рр, 
т.е. то, что получили бы формальной заменой в (7.74) К на А +1. 
Обозначим Ву =Е- © А; (— невязка для А; отно- 


сительно [Ехо )]' ). 
Докажем, что при любом А е №ш скалярные последователь- 
ности (рр), 6 (5,) мажорируют последовательности норм 


векторов Е(х(9) и матриц Ч), В; соответственно и, вместе с 
тем, А ограничивает сверху ||А ; |. С этой целью сделаем индук- 


ционное предположение, что одновременно выполняются нера- 
венства: 


[2] = р, МИ ьь ПВА и АА. (0.75) 
Тогда можно проделать следующие выкладки: 
м [Е Род | = [В+ Ах — РА, | < 
«Ива ДО хак + ДАК < 
511’ р +147 р = В 
(см. (7.11), (7.75), (7.74), (1.72); 


Ива = В А = Е )А, - Р)Адч | = 
= | №? < Вр = 


(см. (7.11), (7.73) и предыдущее неравенство); 
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оо оды р 


«ва: + Ак РКФ) 5+ 
РАНЕ < р = ран 


(см. (7.66), (7.11), (7.75), (7.74), (7.71)); также из (7.11) следует, 
что 


[А Ах + № < А + 4+4 
А А 
п <|Аз|- пам 51Ао П(+А,) 
= = 


[2 В 
но Ву = 5 у? (действительно, из предположения, что 


| 
Ви той ‚ получаем 


1 2_1 1251)? 12 
ВЕЕР ру ра} = Вы =?" =), 


поэтому далее можно продолжить оценивание так: 


К 1 2 1213 ; 
Ао: Па Чад Ху |= 
1=0 


| 
1 ий" 

= [Ао 1+5 | [Ач <1 
р 1-и 


2-и 
2-2 
(последнее, в силу наложенного на и условия (7.69)). 

Так как <) = ро, согласно заданию (7.71), а |Во|< 5% 
по условию (7.68) и, кроме того, |А‹| < Я (ибо в противном случае 
должно быть и<0, что противоречило бы определению и в 
(7.69)), то в соответствии с принципом математической индукции 


доказываемое мажорирование действительно имеет место при 
любом Ае №. 
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Итак, из предыдущего отберем только нужную для приме- 
нения теоремы 7.3 информацию. Имеем: 


о и АК 52, 
ры, 


Ре = Сор, где Сб — 4142, Ро = [<] 


(т.е. д=2, и=Оору = 4112 ро). 


Поскольку здесь на величину у наложено более сильное, 
чем в теореме 7.3, ограничение (7.69), с этим и заключительная 
часть теоремы 7.3 будет тем более верна. Теорема доказана. 


Условие (7.69) теоремы 7.7 можно трактовать так: параметр 

Я > 0 должен удовлетворять кубическому неравенству 
3 р 
41ро -2ЦАро^ - 1 +Ао] 0. 
Исследование этого неравенства приводит к ряду следствий [35]; 
наиболее простым из них (в некотором смысле) является 
Следствие 7.1. Квадратичная сходимость начатого с 
х(0), Ао метода (7.11) обеспечивается выполнением условий 


|Е-^оФА, | =0.109, ЦА?) < 0.0567, 
5х, „= 2.46 ДАР) м.” 


Привлечение общих теорем 7.3, 7.4 о сходимости итераци- 
онных последовательностей позволяет сформулировать и дока- 
зать утверждения типа теоремы 7.5 о квадратичной сходимости 
основного метода Ньютона и для случая, когда итерационная по- 
следовательность (<) задается полюсным методом Ньютона 
(7.53). При этом требование 1) теоремы 7.5 остается тем же, а 


требование 2) о существовании и равномерной ограниченности 
матрицы, обратной к матрице Якоби Е’(х), в п-мерной области 


* 
) Как показывают более тонкие исследования, фигурирующие 
здесь постоянные 0.109 и 0.0567 сильно занижены (см., например, [203], 
где в этой роли выступает одна постоянная 0.25). 
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М заменяется таким же требованием к «смещенной» матрице 
Якоби Е'(х)+А, где А =А(х) — это определенная посредством 


(К) 


(7.51) матрица А; = А((®), в которой х`’ заменяются на х. 


Замечание 7.7. Приведенный в этом параграфе цикл теорем можно 
значительно расширить и обобщить. 

Во-первых, без каких-либо существенных изменений все эти утвер- 
ждения могут быть доказаны для нелинейных операторных уравнений в 
банаховых пространствах. 

Во-вторых, вместо условия Липшица на Ё”(х) (которое, кстати, 
легко можно заменить требованием ограниченности ||Е”(х}]] в М посто- 


янной /,) можно вставить более слабое условие Гёльдера 
[“д-Е’') |= х-х|, <= (0, 1], 


частным случаем которого является условие Липшица. При этом порядок 
д метода в теоремах типа теорем 7.5, 7.7 может быть установлен «пла- 


вающим» от 1 до 1+ в зависимости от жесткости требований, наклады- 
ваемых на исходные данные [39, 40]. 

В-третьих, общие теоремы 7.3 и 7.4 позволяют исследовать сходи- 
мость методов более высоких порядков как с аппроксимацией обратных к 
матрицам Якоби матриц, так и без нее, например, методов третьего по- 
рядка (7.9) и (7.12). 

Использование техники оценочных функций, ключ к которой можно 
найти в книге [86] Л. Коллатца, а также обобщение леммы 7.2 на случай, 
когда условие Липшица или Гёльдера накладывается на производные 
более высоких порядков, позволяют указывать условия сходимости се- 
мейства методов вида 


х (+0 = х® — 0 ®, А, 


содержащего изученные здесь методы и ряд других методов. 


В заключение отметим, что применение теорем сходимости 
типа теорем 7.5-7.7 и других подобных утверждений для кон- 
кретных нелинейных систем упирается, как правило, в проблему 
нахождения постоянных Липшица Г[ для производных вектор- 
ных функций. Даже в простейшем случае, когда Г находится из 
условия [>|Е”(х)|, требуется сделать оценку величины нормы 


От 
дх;ду, 


п-мерной области М ‚ что весьма непросто. 


п 


функциональной матрицы Гессе в некоторой 


ьлт= 
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УПРАЖНЕНИЯ 


7.1. Проведите доказательство теоремы 7.1 по аналогии с доказа- 
тельством теоремы 6.1. 


7.2. Проведите доказательство теоремы 7.2 по аналогии с доказа- 
тельством теоремы 6.2, используя лемму 7.1. 


7.3. Можно ли утверждать, что система 
х= 0.1$тх + 0.3с05 у- 0.4, 
у= 0.2 созх- 0.15ту- 0.3 


имеет и притом единственное вещественное решение? Почему? Сделайте 
2 итерации МПИ (7.3), начиная процесс с нулевого начального вектора, и 
оцените погрешность с помощью априорной оценки теоремы 7.1. Найдите 


решение с точностью ==10-6, останавливая процесс вычислений на ос- 
нове апостериорной оценки погрешности. Сделайте 2 шага метода поко- 
ординатных итераций (7.4). Сравните результат с предыдущим. 


7.4. Дана система 


хз = + 0.1=0, 
ху- 0.95 =0 

и точка (хо; уо)= (1; 1). Запишите для этой системы основной (7.6) и мо- 

дифицированный (7.8) методы Ньютона и сделайте по 2-3 итерационных 


шага. Попытайтесь применить здесь какие-нибудь подходящие теоремы 
сходимости (см. теоремы 7.1, 7.2, 7.5, 7.6). 


7.5. Сравните по числу арифметических операций, приходящихся на 
реализацию одного итерационного шага при решении и-мерной нелиней- 
ной системы, следующие методы: 

а) метод Ньютона в явной форме (7.6); 

6) метод Ньютона в неявной форме (7.7); 

в) аппроксимационный аналог метода Ньютона (7.11); 

г) простейший метод секущих (7.14); 

д) разностный метод Ньютона (7.13); 

е) метод секущих Бройдена (7.32)—(7.34) или (7.26), (7.35); 

ж) полюсный метод Ньютона (7.50)—(7.52) или (7.53). 


Подсчет вычислительных затрат вести, предполагая, что решение линей- 
ных систем в (7.7), (7.32), (7.50) и обращение матриц в (7.6), (7.14), (7.13), 
(7.26) и (7.53) производится методом Гаусса и что вычисление значений 
функций и производных при этом во внимание не принимается, т.е. эти 
значения считаются уже найденными. 
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7.6. Запишите алгоритм решения нелинейных систем такой модифи- 
кацией метода Ньютона, при которой частные производные в матрицах 
Якоби аппроксимируются симметричными разностными отношениями: 


9 _ Л, й ‚х) +Й,, й ‚х„)- Л, в } х-Йй,й пабы) 


Увеличатся ли вычислительные затраты при переходе от (7.13) к такому 
симметричному разностному методу? 


7.7. Дополните рассмотрение численного примера $ 7.7 (табл. 7.1) 
применением методов третьего порядка (7.9) (или, что то же, (7.10)) и 
(7.12). Проведите сравнительный анализ полученных результатов. 


7.8. Запишите аппроксимационные аналоги (типа ААМН (7.11)) для 
методов секущих (7.14) и (7.26). Протестируйте новые методы на систе- 
ме (7.58). 


7.9. Выведите расчетные формулы метода Брауна (см. $ 7.3) для 
трехмерного случая. Опробуйте полученные формулы на системе 


же —2=0, 
х? +у2 22 =0, 
шх-/у+0.8=0, 


взяв начальное приближение ху =0.5, уд =0.5, 20 =0.5. Проверьте ре- 


зультаты тем же методом Брауна, но примененным к двумерной системе, 
к которой легко перейти от данной исключением 2. 


7.10. Убедитесь, что и-полюсный метод Ньютона (7.53) действи- 
тельно обобщает однополюсный (5.36) и двухполюсный (7.44) методы 
Ньютона при и={1 и п=2 соответственно. При каких значениях парамет- 
ров и-полюсный метод превращается в основной метод Ньютона (7.6)? 


7.11. Составьте гибридный алгоритм, осуществляющий поиск ре- 
шения нелинейной системы сначала методом градиентного спуска, а затем 
методом Ньютона или какой-либо его быстросходящейся модификацией. 
Примените построенный алгоритм к системе из предыдущего упражнения 
при различных начальных точках (в частности, при хо = Уд =20 =0). 
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ГЛАВА 8 А 
ИНТЕРПОЛЯЦИЯ 


Прежде всего, обсуждаются различные постановки задачи 
аппроксимации функций одной переменной, в частности, поли- 
номиальной аппроксимации. Далее конкретизируется задача ин- 
терполяции, определяется решающий эту задачу интерполяци- 
онный многочлен Лагранжа, доказывается его единственность, 
выводится остаточный член. Рассматривается итерационный 
принцип вычисления промежуточных значений таблично задан- 
ных (сеточных) функций с помощью лагранжевой интерполяции, 
известный как интерполяционная схема Эйткена. Для случая 
равноотстоящих узлов вводятся конечные разности, отмеча- 
ются их простейшие свойства, строятся конечно-разностные 
интерполяционные многочлены, в структуру которых заложено 
убывание значимости каждого последующего слагаемого. Фор- 
мулы такой же структуры, использующие аппарат разделенных 
разностей, выводятся и для неравных промежутков между уз- 
лами. Завершается глава изучением задачи обратного интерпо- 
лирования и задачи интерполирования с кратными узлами; по- 
следняя объединяет в себе лаграижеву интерполяцию и 
локальную аппроксимацию функций по формуле Тейлора. 


8.1. ЗАДАЧА И СПОСОБЫ АППРОКСИМАЦИИ 
ФУНКЦИИ 


В основе большинства численных методов математического 
анализа лежит подмена одной функции Х(х) (известной, неиз- 
вестной или частично известной) другой функцией ф(х), близ- 
кой к /(х) и обладающей «хорошими» свойствами, позволяю- 
щими легко производить над нею те или иные аналитические или 
вычислительные операции. Будем называть такую подмену аи- 
проксимацией ) или просто приближением функции 1 (х) 
функцией ф(х). Для того, чтобы построить какую-то разумную 
теорию таких приближений и предложить конкретные способы 
получения аппроксимирующих функций ф(х) по заданным тем 


* 
) Часто термин «аппроксимация функций» используется в более 
узком смысле, чем это принимается здесь. 
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или иным образом аппроксимируемым функциям /(х), предва- 
рительно следует ответить на ряд вопросов. 

1) Что известно о функции Г(х)? Задана ли она своим ана- 
литическим выражением или таблицей своих значений, какова 
степень ее гладкости и доступны ли значения ее производных, 
как расположены точки в интересующей части области опреде- 
ления Г(х), где известны ее значения, и можно ли их задавать по 
своему усмотрению, ит.п. 

2) Какому классу (семейству) функций должна принадле- 
жать функция Ф(х)? Какие дополнительные требования предъ- 
являются к ф(х), выделяющие ее из заданного класса? 

3) Что понимать под близостью между }(х) и Ф(х); ина- 
че, какой принять критерий согласия между ними? Говоря язы- 
ком функционального анализа, по метрике какого пространства 
должно быть малым расстояние между Г(х) и Ф(х) ? 

Как видим, задача аппроксимации функции /(х) функци- 
ей @(х) состоит в построении для заданной функции Г(х) такой 


функции ф(х), что 
1(х) =ф(х), (8.1) 


причем левая часть приближенного равенства (8.1) должна быть 
обусловлена ответами на вопросы первой группы, правая часть 
— второй группы, а ответ на вопрос 3) должен уточнить значе- 
ние связывающего /(х) и Ф(х) символа «=». 

Прежде всего, определимся с ответом на второй вопрос. До- 
говоримся использовать в качестве аппроксимирующих функ- 
ций ф(х) только многочлены или функции, составленные из мно- 


Е 
гочленов ); в таком случае будем говорить о полиномиальной 
аппроксимации или кусочно-полиномиальной аппроксимации 
соответственно. 

По сравнению с другими семействами функций, пригодных 
для построения теории приближений, например, таких, как три- 
гонометрические или показательные функции, рациональные 
функции или всплески [18], для вычислительной математики 
многочлены привлекательны тем, что они являются линейными 
функциями своих параметров (коэффициентов), и их вычисление 
сводится к выполнению конечного числа простейших арифмети- 
ческих операций — сложения и умножения. 


* 
) За небольшим исключением в $ 10.1. 
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Будем считать, что аппроксимация функции Х(х) произво- 
дится с помощью многочленов степени ие №. Тогда в зависи- 
мости от выбора критерия согласия и, в частности, от количества 
точек согласования Г(х) с Ф(х) (будем называть их узлами), 
т.е. точек, в которых известна информация об Г(х) и, возможно, 
ее производных, можно рассмотреть разные конкретные способы 
аппроксимации. Некоторые из них, нашедшие отражение в 
табл.8.1, будут изучаться ниже. А именно, в данной главе будет 
достаточно подробно рассматриваться классическая лагранжева 
интерполяция (клетка 1.2 в табл.8.1), служащая основой многих 
численных методов, в частности, приближенного дифференци- 
рования и интегрирования. Здесь же можно будет получить 
представление об интерполяционном многочлене Эрмита (клет- 
ка 2.1), частными случаями которого являются, с одной стороны, 
многочлен Тейлора (при 1=1), с другой — многочлен Лагранжа 
(при {=и-+1). Понятие о многочленах наилучших равномерных 
приближений (клетка 3.3) дается в главе 9, наилучшие средне- 
квадратические приближения (клетка 4.3) освещаются в главе 10, 
а кусочно-полиномиальной аппроксимации (клетка 1.3) и сплай- 
нам (клетка 2.3) посвящена глава 11. 


Таблица 8.1 


Тип функции Фф (х), аппроксимирующей Г (х), выраженной через 
многочлены степени п (при разных условиях согласования) 


Количество точек согласования (узлов) 


Критерий согласия 


Совпадение значе- ы | 1.2 Интер- Е Кусочно- 


поляционный | полиномиальная 
многочлен функция 
Лагранжа 


ний функций Г(х) 
и ф(х) в узлах 


Совпадение в узлах 
функций /(х) и 
Ф(х) и некоторых 
их производных 


2.1 Интерпо- |2. 2.3 Интерполяци- 
ЛЯЦИОННЫЙ онный сплайн 
многочлен 

Эрмита 


Минимум  макси- |3. я 3.3 Многочлен 

мального отклоне- наилучшего 

ния (на отрезке) равномерного при- 
ближения 


Минимум средне- |4. ь 4.3 Многочлен 
квадратического наилучшего сред- 
отклонения (в уз- неквадратического 
лах или на отрезке) приближения 
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8.2. ИНТЕРПОЛЯЦИОННЫЙ МНОГОЧЛЕН 
ЛАГРАНЖА 


Пусть в точках хо, х1,й , хи таких, что а < хо <й <х, ЗЬ, 
известны значения функции у = Х(х), т.е. на отрезке [а, Ь] задана 
табличная (сеточная) функиия 


хмм |= 
(Хх): . 8.2 
7 = УГУ [й [У - 


Функция ф(х) называется интерполирующей или интер- 
поляционной для 1(х) на [а,Б], если ее значения 
Ф(хо), Ф(),й , Ф(х„) в заданных точках хо, хьй , хи, называе- 
мых узлами интерполяции, совпадают с заданными значениями 


функции Х(х), т.е. с уд, УЬй ‚У, соответственно”). Геометри- 
чески факт интерполирования означает, что график функции 
ф(х) проходит так, что, по меньшей мере, в и + 1 заданных точ- 
ках он пересекает или касается графика функции Х(х) (рис.8.1). 


Рис.8.1. Геометрическая интерпретация задачи интерполирования 


Легко представить, что таких графиков ф(х), проходящих 
через заданные точки, можно изобразить сколько угодно, и они 
могут отличаться от графика /(х) сколь угодно сильно, если не 
накладывать на ф(х) и Г(х) определенных ограничений. 


*) Латинское слово пиегро[айо переводится как обновление, изме- 
нение, переделка. Обычно термин интерполяция (или иначе, интерпо- 
лирование) означает процесс построения интерполяционной функции 
или процесс нахождения промежуточных значений табличной функции. 
Этот термин введен в 1656 году английским математиком Джоном Валли- 
сом (Уоллисом, 1616-1703 гг.); кстати отметим, что годом раньше он ввел 
ныне общепринятый символ бесконечности (<) [199]. 
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В соответствии с договоренностью предыдущего параграфа 
будем считать, что интерполяционная функция ф(х) есть много- 
член степени и. Тогда задача интерполяции, точнее, полино- 
миальной, алгебраической или параболической интерполяции 
(поскольку график любого многочлена называют параболой) 
формулируется так: 


для функции Г(х), заданной таблицей (8.2), найти много- 
член Р,(х) такой, что выполняется совокупность условий 
интерполяции 
Р,(х;)= У; У1>{ 0,1, й 5 (8.3) 
Найти многочлен Р,(х) — это значит, учитывая его кано- 
ническую форму 
Р,(х) = ад +ах+аох? +й +алх", (8.4) 
найти его и+1 коэффициент а0, а1,й ‚ аи. Для этого имеется как 
раз и-+1 условие (8.3). Таким образом, чтобы многочлен (8.4) 
был интерполяционным для функции (8.2), нужно, чтобы его ко- 
эффициенты ао, а1,й , а, удовлетворяли системе уравнений 


ад +а1хо +2 +й +а,хд = Уд, 


ад +а1х| +а2х? +йЙ арх =, 


ар -+ацхи +аох2+й +ах"=у,. 


Из курса алгебры известно, что определитель этой линейной сис- 
темы (так называемый определитель Вандермонда) отличен от 
нуля, т.е. решение этой системы существует и единственно. Од- 
нако практическое построение интерполяционного многочлена 
таким путем малоэффективно. Поэтому изберем другой путь. 
Будем строить многочлен и-й степени Г„(х) в виде линей- 


[Ш 
ной комбинации У`с//;(х) многочленов и-й же степени //(х) 
1=0 
(= ;в) ы Для того, чтобы такой многочлен был интер- 
поляционным для функции /(х), достаточно зафиксировать в 
качестве коэффициентов с; этой линейной комбинации заданные 
в табл.8.2 значения у; = Х(х;), а от базисных многочленов /;(х) 
потребовать выполнения условия 


* 
) В отличие от общепринятых для многочленов обозначений, здесь 
индексу /;(х) показывает не степень, а номер многочлена от 0 до п. 
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а 
ибу)-в, = ур, Ьй ,и}. (8.5) 


1, если /=7 


В таком случае для многочлена 


(= Уи) 


1=0 
в каждом узле х; (1Е{0,й ‚и}), в силу (8.5), справедливо 
(ху) = 10 )уо + +1) рае Геры + 
й +1, у» =О+й +О+у,+0+й +0=у,, 
т.е. выполняются условия интерполяции (8.3). 


Чтобы конкретизировать базисные многочлены /,(х), уч- 


тем, что они должны удовлетворять условиям (8.5). Равенство 
нулю 7-го многочлена во всех узлах, кроме 1-го, означает, что 
1, (х) можно записать в виде 


1х) = АКх-х)й (хм )хЬ-хьуй (-ж), 

а коэффициент А; этого представления легко получается из со- 
держащегося в (8.5) требования /;(х;) =1. Подставляя в выраже- 
ние /;(х) значение х=х; и приравнивая результат единице, по- 
лучаем 

_ 1 

С-м)й бля -хнй @-ж) 

Таким образом, базисные многочлены Лагранжа имеют 


А: 


1 


вид 


Е (ххх й (хх) -хыдй (хх) 

1 ИВ Й 
(р хо)и-х)й (хи -хн)й (и -хи) 

а искомый интерполяционный многочлен Лагранжа есть 
2) _ $ -0)й и-наеныйй (ка) 

5о (м -хо)й (ха) хай и -х) 

Заметим, что числитель, фигурирующий в записи 1-го сла- 
гаемого [„(х) дроби, представляет собой произведение разно- 


стей между переменной х и всеми узлами, кроме 1-го, а знаме- 
натель — произведение разностей между 1-м узлом и всеми 
остальными. 


У:. (8.6) 
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В качестве примера запишем интерполяционные многочле- 
ны Лагранжа первой и второй степени. 
При и=|! информация об интерполируемой функции 
у = /(х) сосредоточена в двух точках: (хо; У) и (х1; 1). Много- 
член Лагранжа в этом случае составляется с помощью двух ба- 
зисных многочленов первой степени (/0(х) и /1(х))) и имеет вид 
Хм Х-х0 


(х) = уч — У. (8.7) 
хол Хх - Хо 


При ип = 2 по трехточечной таблице 


ры ю м №2 
969 = о 
У | 01 У | У2 


можно образовать три базисных многочлена (/0(х), /1(х) и 
12(х)) и, соответственно, интерполяционный многочлен Ла- 
гранжа второй степени 


( ) = (хх) —л^2) (х— хо (х— 2) 


[2(х я 


яж -ю)’ м-юХ-ю)” 


(Хм) фм) 
(ха — хо) -х)°* 


(8.8) 


Приближенн ые равенства 


1®=И<) и  Л(х)=10() 


называют соответственно формулами линейной и квадратич- 
ной интерполяции. Геометрически они означают подмену гра- 
фика функции у = Х(х) на некотором отрезке [а, В] оси абсцисс, 
содержащем точки хо, х1 в первом и хо, х1, Х2 во втором случа- 
ях, соответствующими участками прямой линии и квадратичной 
параболы, проходящих через заданные точки координатной 
плоскости. 

Такая простейшая интерполяция широко применялась при 
составлении различных таблиц значений функций для их попол- 
нения промежуточными значениями (что и являлось основной 
задачей интерполяции на ранней стадии развития вычислитель- 
ной математики). В связи с этим, заметим, что иногда термину 
интерполяция противопоставляется термин экстраполяция. В 
таких случаях речь идет о том, что под интерполяцией понимает- 
ся нахождение промежуточных значений таблично заданной 
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функции строго внутри таблицы, тогда как экстраполяция 
предполагает использование интерполяционного многочлена, 
построенного по значениям функции /(х) в точках хо, х,й ‚хи, 
для нахождения ее приближенных значений за пределами 
промежутка [хо , хи |. 

Вернемся к изучению интерполяционного многочлена Ла- 
гранжа (8.6). 

Покажем его единственность (от противного). — Предпо- 
ложим, что наряду с Г„(х) имеется другой многочлен и-й степе- 
ни О„(х), решающий ту же задачу интерполяции, т.е. удовлетво- 
ряющий условиям интерполяции типа (8.3): 


О,(х) =у У1>е{0,1,й ‚п}. 
Образуем новый многочлен как разность между [„(х) и О,„(х). 
Этот многочлен Р,(х):= [,(х)-О,„(х) имеет степень не выше и 
и во всех и+1 узлах хо, х,й ‚ х„ обращается в нуль, в силу ра- 
венства значений О, (х;) и [„(х;) одним и тем же числам у;. По- 
лучается, что точки хо, х,й ‚х, служат корнями многочле- 
на Р,(х). Но по следствию из основной теоремы алгебры 
многочленов Р,(х) не может иметь более и корней. Полученное 
противоречие означает, что многочлены О„(х) и [„(х) должны 


полностью совпадать, т.е. ио заданным п-+1 значениям функции 
можно построить единственный интериоляционныи многочлен. 


Пусть для данной функции {(х) интерполяционный много- 
член [,(х) построен, т.е. для приближенного представления 
функции Х(х) на отрезке [а, В] 5 [хо,х„] применяется интерпо- 
ляционная формула 

Л) = Г (х). (8.9) 
Естественно встает вопрос: какова погрешность такого прибли- 
женного равенства? Иначе, сколь велико может быть различие 
между значениями интерполируемой функции Г(х) и соответст- 
вующими значениями интерполяционного многочлена Лагранжа 
[„(х) в точках отрезка [а, 6], не совпадающих с узловыми точ- 
ками? 


* 

) Указанный здесь узкий смысл терминов «интерполирование» и 
«экстраполирование» становится очевидным, если учитывать их латин- 
ское происхождение: «п\ег» и «ехга» означают соответственно «между» и 
«вне», а «роге» — «делать гладким» [200]; таким образом, интерполиро- 
вание — это сглаживание между узлами, а экстраполирование — сглажи- 
вание вне таблицы. 
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Для совершенно произвольной функции Г(х) такая поста- 
новка вопроса о погрешности интерполяции заведомо некор- 
ректна, поскольку функций, для которых построенный (единст- 
венный!) многочлен /„(х) будет интерполяционным, бесконечно 
много; легко представить себе эту ситуацию графически: через 
п+1! заданных точек с координатами (хо; уд), (м; у), й, 
(х„; у), согласно доказанному, можно провести единственную 
параболу — график многочлена степени и — и, в то же время, 
можно изобразить сколько угодно графиков других функций, как 
угодно сильно отличающихся от этой параболы. Этот факт гово- 
рит о том, что заключить величину этого отклонения, т.е. по- 
грешность интерполяции, в определенные рамки невозможно, 
если не наложить каких-то ограничений на гладкость интерполи- 
руемой функции Г(х) и на расположение узлов интерполяции 
хо, хьй , х, на отрезке [а, в]. 

Будем выяснять величину отклонения /(х) от /„(х) в про- 
извольной точке хе [а, 6], иначе, величину остаточного члена 


К„(х):= 7(х)- 1. (х) 
интерполяционной формулы Лагранжа (8.9) в предположении, 


что /(х)Е РН т.е. данная функция и +1 раз непрерывно диф- 


ференцируема. 
Обозначим 


Пин) Ц -х) = жид (и-х,) — (8.10) 


— определенный через узлы хо, х,й ‚х,„ многочлен (и+П-йЙ 
степени. Через него введем в рассмотрение функцию 


и(х):= 1) -1.@<)-сП,@), (8.11) 
где с — некоторая постоянная (параметр). 

Так как в точках х=хо, х,й ‚ х„ многочлен П„.1(х) обра- 
щается в нуль, согласно его конструкции, а Х(х)-1Г„(х)=0 в 
этих точках по условиям интерполяции, то и и(х;)=0 при 
1=0,1,й ‚пи, т.е. функция и(х) имеет на отрезке [а, В] по мень- 
шей мере и+1 корень. Подберем параметр с так, чтобы и(х) 
имела заведомо еще и (и+2)-й корень в какой-то фиксирован- 
ной точке Хх (> х;) промежутка [а, Ь]. Имеем: 


‚9-6 
Пи+1(%) 


) 


и(®)=0 > /9-Ь@)=сп,и@) > 
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причем такое значение с обязательно найдется, поскольку 
П„-1(х) = 0 только в узлах х;. 

Пусть для определенности ХЕ (х,, х;.1). Тогда можно ут- 
верждать, что при найденном с функция и(х) равна нулю на 
концах и+1 отрезков [хо, х1|, [м1 х2], й , [хх], [, ха], Й , 
[х„_1, х„|. Значит, к функции и(х) на каждом из этих отрезков 
применима теорема Ролля, т.е. внутри каждого из этих отрезков 
существует, по крайней мере, по одной такой точке, в которой 
производная функции и(х) обращается в нуль. Эти и+1 точки 
образуют систему из и отрезков, на концах каждого из которых 
уже функция и’(х) равна нулю, т.е. теперь к производной можно 
применить теорему Ролля, по которой существует и нулей вто- 
рой производной функции и(х). Продолжая процесс таких рас- 
суждений далее, в конце концов, приходим к выводу о ще 
вовании такой точки @&Е(ху, х„) < (а, Ь), что и("+1) (Е) =0. 
Учитывая, что и-я производная многочлена и-й степени посто- 
янна, а (и+1)-я равна нулю, находим выражение (и +1)-й произ- 
водной функции и(х), заданной равенством (8.11): 


и" (х) = 2+0 (>) 0-с(и+1. 


Итак, существует точка & е (хо, х„ ) такая, что 


(+1) 
У оба, те вы’ © ©) 
(и+! 


Это значение с должно совпадать с выбранным ранее, т.е. долж- 
но выполняться равенство 


1-1.) _ Ге) 
Пи) (+0! ’ 


откуда получаем 
(и-+1) 
Ре) Оп Пит (х). 


= ря 


Так как в качестве х могла быть взята любая точка х из проме- 
жутка [а, |], не совпадающая ни с какой узловой, расфиксируем 
(или, как еще говорят, разморозим) точку х, т.е. заменим ее в 
последнем равенстве произвольной точкой х=х;, в результате 
чего приходим к выражению остаточного члена 


"+ (=) 


рн: п". (8.12) 


Ки (х) = 
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Знание остаточного члена в предположении (и +1)-кратной 
дифференцируемости /(х) позволяет записать точное представ- 
ление /(х) через ее интерполяционный многочлен /„„(х): 


(п+1) 
до од + Отьнб, 13) 


где & — некоторая (вообще говоря, неизвестная, причем завися- 
щая от х) точка из промежутка интерполяции (а, Ь), а П„.1(х) 


— определенный в (8.10) многочлен”). 

Теперь можно ставить и пытаться отвечать на вопросы о 
погрешности приближенного вычисления значения Х(х) с по- 
мощью Г„(х) в какой-либо конкретной точке промежутка [а, 6], 
о величине максимальной погрешности, допускаемой при под- 
мене функции /(х) многочленом Г,„(х) на этом промежутке, о 
сходимости интерполяционного процесса, т.е. о том, имеет 
ли место р((х), „(х))—> 0 по метрике р(.,-) того или иного 


определенного на [а, 5] функционального пространства. 
Так, если известна величина 


то оценить абсолютную погрешность интерполяционной 
формулы (8.9) в любой точке Хе[а, Ь] можно с помощью 
неравенства 


|, (7) =) - 5, < Е П„-1(). — (814) 
Максимальная погрешность о на отрез- 
ке [а, Ь] оценивается величиной 


М» 
тах |®,„(х)|< Е х [|П,1@)|. (8.15) 
хе[а, В МИЯ | 
Так как максимумы к. я и П„.1(х) достигаются, 
вообще говоря, в разных точках отрезка [а, 6], то более точной, 


но более трудно реализуемой по сравнению с (8.15) следует счи- 
тать оценку 


В 
= ьН | „= (п+1)! ра И 


а ина 


* 

) Формула (8.12) устанавливалась для значений х*х;. Но при 
х=х,; левая и правая части (8.12) равны нулю, следовательно, формула 
(8.12), а с нею и представление (8.13), справедливы при любых хе [а, Ь]. 
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Пример 8.1. Рассмотрим квадратичную интерполяцию функции 


. п : 
у=зшх на отрезке [о = по ее трем значениям: $т0=0, 
>. ИЕ 2 Е 
зтш—=—, зш—=1. 
4 2 2 
По формуле (8.8) строим многочлен Лагранжа второй степени 


1-0. а «9 


или после преобразований 


\}2 1 
бои (-У/2)х+ нЕ л |. (8.16) 
л2 2 4 
Остаточный член для этого случая получаем по формуле (8.12), учитывая, 
у п п 
что и=2, (зтх)”=-совх и По.(х)= 5-7 [х-2). 


Имеем: 


в -вае-ь = т х- х-7). 


п 
Так как точка & е (о, =) неизвестна, можно делать лишь оценки [> (х], 
полагая М = тах |-с0зх| =1. Найдя максимальное значение | Пз(х], 
хе] 0,7 
2 
4 В 
реализуемое в двух точках данного отрезка х| о ит З+У3З) и не превос- 


ходящее 0.568 , по формуле (8.15) оцениваем сверху величину допустимо- 
го отклонения дуги параболы (8.16) от данной синусоиды на промежутке 
интерполирования: 


1 
тах |зтх- /2(х)] <— шах |125 (х] < 8 0.095. 
л 3! л 


хе, | 1е|о, 
2 2 
Подставим в полученный интерполяционный многочлен (8.16) кон- 


трольную — точку = Получим  приближенное — значение 


6 
чину = 0.017, меньшую, чем это допускается оценкой по формуле (8.14): 


(=) 4/2 -—1 


Л 
= = 0.517, отличающееся от значения и на вели- 
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м} 
3! 


З 
Е «(= = 0.075. 
6\6 


9 


Наблюдаем типичную картину: фактическая погрешность меньше оценки 
погрешности в точке, которая, в свою очередь, меньше максимальной по- 
грешности на отрезке (т.е. по чебышевской норме). 


эт ь(= < 
6 6 


В заключение этого параграфа заметим, что через введен- 
ный в (8.10) многочлен П„.1(х) интерполяционный многочлен 
Лагранжа (8.6) можно записать в более компактной форме. Для 
этого достаточно увидеть, что знаменатель фигурирующей там 
дроби представляет собой значение производной многочлена 
Пи -1(х) в 7-м узле, а числитель есть просто П„.1(х) без множи- 
теля х-х;. 


Таким образом, 


я Па @, |. У; 
Ди = ЕН, щи, (В: 
©) ра (х- м Пи +1(х;) 1), ое м Уи (х;) а 


Вопросы сходимости Г„(х) к Х(х) при и -—> ® будут обсу- 
ждаться несколько позже (см. $ 8.5). 


8.3. ИНТЕРПОЛЯЦИОННАЯ СХЕМА ЭЙТКЕНА 


Пусть функция /(х) и расположение узлов хо, х,й ‚х,„ на 
промежутке интерполяции [а, 6] таковы, что имеет место сходи- 
мость процесса интерполяции, т.е. К„(х) > 0 при п —> ©, и пусть 
решается частная задача вычисления отдельных приближенных 
значений функции Х(х) с помощью вычисления соответствую- 
щих им значений интерполяционного многочлена Лагранжа 
1, (х). Для построения эффективного способа решения такой ча- 
стной задачи интерполяции примем во внимание следующие три 
обстоятельства. 

Во-первых, непосредственное использование многочлена 
Лагранжа в форме (8.6) неудобно из-за его громоздкости (что 
чревато большими вычислительными затратами). Во-вторых, как 
правило, заранее неизвестно, какой степени многочлен нужно 
использовать для интерполирования данной функции с требуе- 
мой точностью, а постепенное наращивание точности за счет по- 
вторных вычислений значений Г„(х) со все большими показате- 
лями степени и (подобно тому, как это можно делать, например, 
при вычислении значений функции по формуле Тейлора) при 
прямом применении формулы (8.6) малоприемлемо, в силу пло- 
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хой перестраиваемости /„_1(х) в Г,„(х). В-третьих, при реаль- 
ном счете всегда следует помнить, что функция Х(х) задается 
таблицей своих приближенных значений, и каноническое 
развитие процесса сходимости Г„(х) к /(х) при больших значе- 
ниях и будет нарушено все возрастающим влиянием на резуль- 
тат исходных ошибок (более подробно об этом см. далее в 
$884, 8.5). 

Построим вычислительную схему для получения прибли- 
женного значения сеточной функции Х(х) в заданной точке 
х=Х, в основу которой будет положена лагранжева интерполя- 
ция на сетке узлов хо, х,й ‚х„ и организация вычислений по 
которой будет иметь итерационный характер. Каждый итераци- 
онный шаг в этой схеме заключается в вычислении некоторого 
определителя второго порядка. 

Пусть даны две точки на кривой у= Х(х): (хо; уб) и 
(21; 7). Введем функцию Ал(х) через определитель следую- 
щим образом: 


хХ-^о У 
хм М 
Раскрыв этот определитель, видим, что 


1 
Ву 1(х) = 
Хх —^0 


© —5м № — м 
В+ и = (а), 
2-м м ^0 


те. А (х) совпадает с интерполяционным многочленом Ла- 
гранжа первой степени, построенным по данным двум точкам 
(сравните с (8.7)). 

Если взять на кривой у = Х(х) точки (х1; ур) и (хд; у>), то, 
очевидно, функция 


1 
Нави —— 
2-м 


хм У 
хХ-х2 У 


% 


в развернутой форме имеющая вид 


В = Ау, 
о 2-м 
тоже является многочленом Лагранжа первой степени, интерпо- 
лирующим Х(х) по точкам (2х1; ут) и (х2; у2). 
Считая, что на кривой у = /(х) заданы три точки (хо; У0), 
(ху) и (х>; у2), с помощью введенных линейных функций 
В 1(х) и В, 2(х) образуем новую функцию 
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х-х Ах) 
х-х› Р2(х) 


Легко видеть, что эта функция есть многочлен второй степени 
(точнее, не выше второй). Учитывая, что 


Ал (м)=уУ, Вл (м)=А,2(м)=я и А2(2)= 2, 
подстановкой в Ру 12(х) поочередно значений х= хо, м1, х› 
убеждаемся, что Р)1,2(х0) = 0, Р,,2(1) = Уь В),1,2(%2) = У2. 
Таким образом, функция К, 12(х) есть многочлен второй степе- 
ни, решающий задачу параболической интерполяции по трем 
точкам (хо; 0), (1; 1), (х2; У2). Но такой многочлен, как до- 
казано в предыдущем параграфе, единствен, следовательно, 
В 1.2(х) = [2(х), где [2(х) — многочлен Лагранжа (8.8). 

Продолжая так рассуждать и далее, приходим к рекур- 
рентному заданию последовательности интерполяционных 


многочленов Лагранжа, которое и составляет суть так называе- 
мой интерполяционной схемы Эйткена: 


1 |х-м Ади <) 
х-ж|х-м Ал К») |’ 


где =1,2,й ‚пи, по определению, Р)(х):= уд, В (х):= у1. 
Методом математической индукции можно показать иден- 
тичность (8.17) при {= и и многочлена Лагранжа (8.6). 


1 


Вл (х)=—— 
Х2 —^0 


1(х) = Вал ((х)= (8.17) 


Пример 8.2. Пусть некоторая функция у= у(х) задана таблицей 
своих значений, округленных до двух знаков после запятой: 


х, | 0.0 | 0.2 | 0.4 | 0.6 | 0.8 | 1.0 | 1.2 
У; | 0.00 | 0.45 | 0.63 | 0.77 | 0.89 | 1.00 | 1.10 


Рассмотрим поведение процесса вычисления двух значений этой 
функции по схеме Эйткена в точках: а) Хх =0.1; 6) х=0.5. Результаты 
промежуточных вычислений (в которых один знак — запасной) сведем в 
табл.8.2 и 8.3 для случаев а) и 6) соответственно. Числа в столбцах, поме- 
ченных посредством Р (Х), представляют собой значения многочле- 


МЕ 

нов Лагранжа А-й степени, построенных по узлам от #-го до (1+ А)-го ре- 

куррентно по формуле 

з | х-х Руцыы@) 

Рады Ре" 29 
. Жк — № НК СЫНА 


где А=Ъ2,й ; Ру у;, в соответствии с интерполяционной схемой Эйт- 
кена (8.17). 


342 


650 = (10) 94 = (10) 


(ГО винаврнЕ ппнаиоптаэ паи внаяшие аигохо э хитомэшорь“ 
‘эонаивогони ханниопйвиоидашии ппнаврнё ашзонаиашиэоо2и2о 


с '3 пиков | 


343 


Таблица 8.3 
Вычисление по схеме Эйткена значения у(0.5) 


жа | Рт(0.5) | Ррр5(0.5) | Ррз5(0.5) | Рд.5) | Ррз(0.5) 


Организация вычислений по формуле (8.18) должна быть такова, что 
если заранее неизвестна степень интерполяционного многочлена, который 
следует использовать для вычисления у(Х), и данная таблица значений 
функции достаточно обширна, то должно происходить постепенное по- 
вышение степени К интерполирующих ее многочленов за счет подключе- 
ния новых, все более удаленных от Х узлов. Порядок заполнения клеток 
табл.8.2 и 8.3 получаемыми по формуле (8.18) числами показан простав- 
ленными в этих клетках номерами. Счет ведется до тех пор, пока идет 
уточнение приближенного значения у(Х), о чем можно судить по умень- 


шению величины |р пе ®)-РуиЕ® | при увеличении КА и подходя- 


щем фиксировании Г. 

Так, для подсчета приближенного значения данной функции в точке 
Х = 0.1, расположенной между узлами хо =0 и х! = 0.2 , целесообразно в 
качестве основной последовательности значений интерполяционных 
многочленов Лагранжа брать числа Р о1(0. П=0.225 = /4 (0.1), 
Ру5(0.1) = 0.259 = [2(0.1) и т.д., т.е. строку табл.8.2, соответствующую 


значению 1=0. Составив разности между последующими и предыдущими 
числами этой строки, а именно: 


0.034 0.014 0.008 0.006 0.004 0.003, 
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видим, что дальнейший счет бессмыслен; по данной информации о функ- 
ции У(х) более точное значение 5(0.1), чем значение 5(0.1) = 0.29, 
ЕЗ 


получаемое с помощью /6 (0.1), найти не удастся 


В случае 6) для вычисления значения у(0.5) оказалось достаточным 
сделать лишь линейную интерполяцию по двум ближайшим к точке 
х=0.5 узлам х›=0.4 и ху=0.6 и с помощью квадратичной ин- 
терполяции по узлам хо = 0.4, хз =0.6 и х4 =0.8 убедиться, что полу- 
ченное линейной интерполяцией значение у(0.5) = 0.70 при этом не изме- 


нилось (см. табл.8.3). 

Столь большое различие в степенях интерполяционных многочле- 
нов и, соответственно, в объеме вычислительной работы при нахождении 
двух промежуточных значений одной и той же функции с помощью ин- 
терполяционной схемы Эйткена нетрудно объяснить, зная, что эта функ- 
ция есть у=\х . Если на левом конце промежутка [0,1.4], на котором она 
задана своими отдельными приближенными значениями, ее производные 
обращаются в бесконечность, что не позволяет эффективно пользоваться 
формулой остаточного члена (8.12) для значения Х=0.1, близкого к 


хо =0, то при вычислении у=\х в точке 0.5 можно считать, что интер- 


" 


поляция производится на промежутке [0.4,1.4], где Мо = тах(Ух) =1, 


"’ 


Мз = тах(Ух) < 4 и, соответственно, 


м 
[А (0.5 < 5, (0.5) = 55 - 0.40.5 —0.6] = 0.005, 


> (0.5)| < = 7, (0.5)| < = (0.5—0.4)(0.5— 0.6.0.5—0.8)| = 0.002. 


Последняя оценка говорит о том, что квадратичная интерполяция позво- 
лила бы вычислить 0.5 с точностью практически до третьего знака после 
запятой, если бы данные в исходной таблице значения функции у=\х 
имели такую же или ббльшую точность. 


Наконец, заметим, что при компьютерных вычислениях за- 
полнение таблиц типа табл.8.2, 8.3, разумеется, не требуется, хо- 
тя визуализация этих промежуточных данных много дает для по- 
нимания процессов интерполирования. Важно при реализации 
схемы Эйткена предусмотреть, например, возможность подклю- 
чения узлов не только последующих, но и предшествующих за- 
данному значению аргумента (из-за конечности таблицы исход- 
ных значений функции), причем в средней части таблицы 
целесообразно чередовать использование информации в после- 
дующих и предшествующих узлах. 


* 
) на один полный итерационный шаг можно было сделать меньше, 
т.е. ограничиться значением 1/5(0.1), если учесть, что разница между 


Ро = (0.1) и Рус(0.1) составляет величину 0.004, меньшую, чем величи- 
на ошибки округления исходных данных (0.005). 
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8.4. КОНЕЧНЫЕ РАЗНОСТИ 


Зададимся целью придать интерполяционной формуле бо- 
лее простой вид, подобный виду широко используемой в матема- 
тическом анализе формулы Тейлора. Если в интерполяционном 
многочлене Лагранжа (8.6) все слагаемые однотипны и играют 
одинаковую роль в образовании результата, хотелось бы иметь 
такое представление интерполяционного многочлена, в котором, 
как и в многочлене Тейлора, слагаемые располагались бы в по- 
рядке убывания их значимости. Такая структура интерполяцион- 
ного многочлена позволила бы более просто перестраивать его 
степень, добавляя или отбрасывая удаленные от начала его запи- 
си члены. 

Поставленной цели будем добиваться сначала для несколь- 
ко суженной постановки задачи интерполяции. А именно, будем 
считать, что интерполируемая функция у = Х(х) задана своими 
значениями уд, У,й ‚ у, на системе равноотстоящих узлов 
х0, хьй ‚хи, т.е. таких, что любой узел х; этой сетки можно 
представить в виде 

х=жЖ +, 
где 1=0,1й,и, а Й>0 — некоторая постоянная величина, 
называемая шагом сетки (таблицы). 

Прежде чем строить желаемые интерполяционные форму- 
лы, рассмотрим элементы теории конечных разностей. 

Вычитая из каждого последующего члена конечной после- 
довательности из и+1 чисел уд, у, й , у, предыдущий, образу- 
ем и конечных разностей первого порядка 

Ау =У-у0, Ая=уУ-У, й [, Аул Уи - Уи 
или, проще, и первых разностей данной табличной функции. Из 


них, в свою очередь, таким же образом можно получить и-—1 ко- 
нечных разностей второго порядка, или вторых разностей: 


2 2 
Ауд =Ау-Ауд, Ау =Ау-Ау, й , 


2 = 
А Уп-2 =Ауи-1 —Аун-2. 
Этот процесс построения разностей может быть продолжен, и 
весь он, очевидно, описывается одной рекуррентной формулой, 


выражающей конечную разность К-го порядка А`у; через раз- 
ности (А -1)-го порядка: 
[+ К-1 К-1 
Ау=А Ушм-А У, (8.19) 


где К =1,2,й,п и Ау, =у,. 
В некоторых случаях требуется знать выражения конеч- 
ных разностей непосредственно через значения функции, 
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лежащей в их основе. Для нескольких первых порядков разно- 
стей их можно получить прямой подстановкой: 


Ду; = У - У 
2 
Ау; =Ау-Ау,; = Ун2 — Ум - См - У) = Уна -2У + У 


3 2 2 
Ау; = А`ун4 -АТу; = Унз -2Ун2 +Ущ - Са -2уна+у,)= 
= У+з-Зу;--2 +Зу-у;, — ИТД. 


Подметив закономерность в коэффициентах рассмотренных 
представлений конечных разностей, записываем общую формулу 


р 
и . 
Ау = У(-1) Сун (8.20) 
/=0 
которая может быть строго обоснована методом математической 
индукции и которая напоминает биномиальное разложение 


для (у- 1. 

Привлекая определение производной, можно обнаружить 
прямую связь между конечными разностями и производны- 
ми. А именно, если учесть, что 


У > Е т Лох +1)- 7@;) 


т =: У) 
17} 
й—0 й #0 й 
то можно сказать, что при малых й имеет место приближенное 


равенство 
, 
Ау; > У (х; ди, 
т.е. первые разности характеризуют первую производную функ- 
ции /(х), по значениям которой они составлены. Пользуясь 
этим, имеем для вторых разностей: 


У:+2 — Уч _ УТУ 


2 
Ау; _ Ау-АУ! _ р п 
п? й2 й 
оз -ГО@ " 
в МА, 


т.е. А?у, = ХР, и, вообще, 
р | | 
Ау, = Г (х,)ИА. (8.21) 
Таким образом, на конечные разности можно смотреть как 


*% 
на некоторыи аналог производных ). Отсюда справедливость 
многих их свойств, одинаковых со свойствами производных. 


* 
) Более подробно связь между производными и конечными разно- 
стями изучается далее в главе 13. 
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Отметим лишь простейшие свойства конечных разностей: 
1) конечные разности постоянной равны нулю (очевидно); 


2) постоянный множитель у функции можно выносить за 
знак конечной разности. 


Действительно, 
А(Су(х)) = Су(х+й)- Су(х) = СБх+й)- у) = СА у(х) 
при любых фиксированных х и постоянной С; 


3) конечная разность от суммы двух функций равна сумме 
их конечных разностей в одной и той же точке. 


Свойство проверяется непосредственно: при любых х 
А(и(х) + (х)) = и(х+ й) + >(х+ И) - (и(х) + %(х)) = 
=и(х+й)- и(х) +у(х + й) — ъ(х) = Аи(х) + Ау(х). 


Свойства 2 и 3 характеризуют операцию взятия конечной 
разности как линейную операцию. 


Учитывая роль, которую играют многочлены в теории ин- 
терполирования, посмотрим, что представляют собой конечные 
разности многочлена. 

Поскольку многочлен в своей канонической форме есть ли- 
нейная комбинация степенных функций, положим сначала 


у=х". Используя биномиальное разложение и-й степени дву- 
члена, получим: 


("= (+) "= ий" + м - и ей "Ай", 


т.е. первая конечная разность степенной функции у=х” есть 


многочлен степени и-—1 со старшим членом пих"-1. Если взять 
теперь конечную разность от функции 


у=адх” + ах" 1 +й +а,х+а,, (8.22) 
то, в силу линейных свойств Ду, можно записать 


А У(х) = в А (=) + а д(х"—!)+ й +а, 1 Ах. 
Первое слагаемое в этой сумме, как выяснено, есть многочлен 
(п- 1)-й степени, второе, аналогично, — многочлен степе- 
нии-2, и т.д. Следовательно, первая конечная разность много- 
члена (8.22) в точке х с шагом Й есть тоже многочлен со стар- 


шим членом аонйх”-\, вторая конечная разность — многочлен 
со старшим членом ади(и—1)й2х"-2, ..., К-я разность — мно- 
гочлен со старшим членом аон(и-Ий (и-Е+ ИИА х" *. 
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При А =и получаем постоянную разность и-го порядка 

АПу = арт!" 
для многочлена (8.22); конечные разности более высоких поряд- 
ков, естественно, равны нулю. 

Итак, главный вывод из предыдущих рассуждений: и-е ко- 
нечные разности многочлена п-й степени постоянны, а (п+1)-е 
и все последующие равны нулю. 

Более важным для понимания сути полиномиального ин- 
терполирования является утверждение, обратное сделанному 
выше выводу. А именно, доказано [58, 123], что если конечные 
разности п-го порядка некоторой функции у = у(х) постоянны 
в любой точке х при различных фиксированных шагах й, то эта 
функция у(х) есть многочлен степени п. 

Для функции у = Х(х), заданной таблицей своих значений 
0,71, Й ‚Уи В Узлах хо, х,й ‚хи, где х; =хо +, конечные 
разности разных порядков удобно помещать в одну общую таб- 
лицу с узлами и значениями функции (последние можно интер- 
претировать как конечные разности нулевого порядка, 
см. (8.19)). Эту общую таблицу называют иаблиией конечных 
разностей. Заметим, что кроме принятого здесь так называемого 
диагонального расположения конечных разностей, когда числа в 
каждом столбце записываются со смещением на полстроки так, 
как это показано в табл.8.4, часто применяют горизонтальное 
расположение, где Ду,, А? у; и другие разности с индексом 1 
помещают в одной строке с х;, у;. 


Таблица 8.4 
Диагональная таблица конечных разностей 
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0781 Ус 
С/7`0 
$90'0 895 ГАТа 
$00'0- [07'0 
100'0- 890'0 196'0 0 
700`0- 00`0- 655`0 
<10'0- $00`0 020'0 <09`0 81 
650`0- 800`0 $00'0- 690 
с90`0- [10'0 $00'0- $/0'0 $650 91 
1Г0- $$0`0 600'0- 000`0 76[`0 
[0<0- $$0'0 9т0`0- 700`0 $20'0 6610 УТ 
0600 $с0'0- [00'0 700`0- 611`0 
$$0'0- 900'0 $00'0- 6200 070`0 Ст 
$10`0 100'0 100'0- 070'0 
[00`0- 700`0- 080`0 000`0 ОТ 
800`0 $00`0 070`0- 
<10`0- [20`0 0$0'0 80 
$10'0 иГо- 
с90'0 [610 9`0 
6211`0- 
955`0 7‘0 
оу | "бу 


с Зе пиков | 


хх = А ппйхнАф пшоонёва эаньано 
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Пример 8.3. Составим таблицу конечных разностей для функции 


У =хш? х по ее значениям, вычисленным с тремя знаками после запятой 
в точках х; = 0.4+0.21, где {=0, 1, й , 10. В соответствии с формой, зада- 
ваемой табл.8.4, заполняем табл.8.5 всеми возможными для этого случая 
конечными разностями. Проанализируем ее. 

Учитывая связь между конечными разностями и производными со- 
ответствующих порядков (см. (8.21)), по смене знаков чисел в столбце 
Ду; можно судить о наличии минимума функции в окрестности точки 
х =1, а положительность всех чисел в столбце 42 у; говорит о выпуклости 
вниз графика данной функции на всем рассматриваемом промежут- 
ке [0.4,2.4]. 

Далее замечаем, что абсолютные величины конечных разностей 
сначала убывают с увеличением их порядка, а затем начинают увеличи- 
ваться. Это типичное поведение конечных разностей при ограничен- 
ной точности задания значений сеточной функции. 


Природу наблюдаемого в примере 8.3 поведения модулей 
конечных разностей нетрудно понять. Если шаг достаточно мал, 
а данная табличная функция — достаточно гладкая, то сначала 


происходит естественное убывание [А У; 


с увеличением К, вси- 


лу упомянутой связи (8.21). Когда эти величины становятся дос- 
таточно малыми, большую роль начинают играть продукты 
взаимодействия исходных ошибок округления (так называемый 
шум округлений). 

Что происходит с одной отдельно взятой ошибкой величи- 
ны & у значения у;, можно проследить по табл.8.6. Как видим, с 
ростом порядка разностей она «расползается» по таблице и уве- 
личивается по абсолютной величине. 


Таблица 8.6 


Продвижение ошибки по таблице конечных разностей 
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Погрешности, имеющиеся у каждого из данных значений 
функции, с ростом порядка разностей все больше взаимодейст- 
вуют. 

Из сделанных наблюдений напрашивается следующий вы- 
вод. Если какой-то столбец в таблице конечных разностей (в ее 
эксплуатируемой части) состоит из чисел, абсолютные величины 
которых составляют всего несколько единиц десятичного знака, 
являющегося последним в записи исходных значений функции, 
скажем, не превосходят величины 10=, где = — абсолютная по- 
грешность исходных данных, то эти конечные разности и разно- 
сти всех последующих порядков не несут практически никакой 
информации о функции, и их не следует использовать. Разности 
же предшествующего столбца называются практически посто- 
янными, и их порядок определяет степень многочлена, которую 
можно и должно использовать для идеальной в данных условиях 
полиномиальной интерполяции. 

Вспоминая о том, что многочлен К-й степени имеет А-е 
разности постоянными, а все последующие — нулевыми, прихо- 
дим к заключению, что если К-е разности таблицы конечных 
разностей некоторой функции практически постоянны, то эта 
функция ведет себя в рассматриваемой области, как многочлен 
К-й степени; эту степень и следует применять для интерполиро- 
вания с наибольшей для данных реалий точностью. 


Обратимся к числовой табл.8.5 нашего примера. Видим, что если 
исключить из рассмотрения верхнюю диагональную строку, то для всей 
остальной части таблицы третьи разности удовлетворят условию 


| »|<10-0.0005 (где 0.0005 — предельная абсолютная погрешность 


значений у;). В такой ситуации разности более высоких порядков не сле- 
довало вообще вычислять, а разности второго порядка можно считать 
практически постоянными, т.е. для подсчета любых промежуточных зна- 
чений данной функции, за исключением, быть может, тех, которые нахо- 
дятся вблизи узла хо = 0.4, нужно применять квадратичную интерполя- 
ЦИЮ. 


8.-5. КОНЕЧНОРАЗНОСТНЫЕ ИНТЕРПОЛЯЦИОННЫЕ 
ФОРМУЛЫ 


Пусть функция у = Х(х) задана на сетке равноотстоящих 
узлов х; =хо +, где 1=0, 1, Й ‚и, и для нее построена таблица 
конечных разностей 8.4. 

В соответствии с тем, что было сказано о направлении мо- 
дификации интерполяционной формулы Лагранжа в начале пре- 
дыдущего параграфа, будем строить интерполяционный много- 


член Р,(х) в форме 
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Р‚(х) = ао +а1(х-хо)+ а2(х -— хо )(х-х1)+й (8.23) 
7 +аи(х — хо )(х — м )й (жил). | 
Его п+1 коэффициент ад, а1,й , а, будем находить последова- 
тельно из и +1 интерполяционных равенств 
Вх) =),  ТвОЪЙ м. 

А именно, полагая 71=0, т.е. х=хо, в (8.23) имеем 
Р, (хо) = ад, а по условию интерполяции Р, (хо) = уд; следова- 
тельно, а0 = уд. 

Далее, при 7 =1 аналогично получаем равенство 

ао + ах = хо) = У, 

в которое подставляем уже найденное значение ау = уд. Разре- 
шая это равенство относительно а и используя обозначение ко- 
нечной разности, получаем 


я- 0 _Ау0 


и 


м -хо й 
Следующий шаг, при 1=2, дает: 
ао + а1 (хо — хо) + аз (хо — хо (хо -м)=уУ <> 


А 
0+ *. йа» -2й.й= уз <> 


2 
-27+ А 
527 6 (см. (8.20) при &=2). 


21й? 212 
Полной индукцией можно показать справедливость выражения 
1 
А 
а =— 20 УЕ 2,В,п}. (8.24) 
КИЙ 


Подставляя найденные коэффициенты ад, а1,й ‚а, в 
(8.23), получаем многочлен 


2 
Ду Ау 
Ри(х) = о + °(х- хо) + р (х-хо (хх!) +й 
АП 
пи з0х м (хх), 8.25) 
п! 


который называют первым интерполяционным многочленом 
Ньютона. 
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Учитывая, что каждое слагаемое многочлена (8.25), начи- 
ная со второго, содержит множитель х — хо, естественно предпо- 
ложить, что этот многочлен наиболее приспособлен для интер- 
полирования в окрестности узла хо (при х, близких к хо, 


ЛС) = уд). Будем называть узел хо базовым для многочлена 
(8.25), и упростим (8.25) введением новой переменной 4 равен- 


ством а = У или (что то же) равенством х=хо + ай. Так как 
при любых {= {0,1,й ‚п} 
хх, =хо +ай-хо —й=#(а-71), 


то в результате подстановки этих разностей в (8.25) приходим к 
первой интерполяционной формуле Ньютона в виде 


Дод Ро +4) зо ло + ВАУ + 


. 99-1 Ч п+ Ви, (8.26) 
п! 
где обозначение Р, (хо + ай) указывает не только на и-ю степень 
многочлена, но и на базовый узел хо и связь переменных х ид. 

Первая формула Ньютона (8.26) обычно применяется при 
значениях |4|<1, а именно, для интерполирования вперед, 
(при хе (хо, х1), т.е. при д Е (0,1)) и экстраполирования назад 
(при х < хо, т.е. при 4 <0). 

Так как реально степени интерполяционных многочленов 
бывают не так велики, в то время как таблицы значений функций 
достаточно обширны, и так как в реальной числовой таблице ни- 
каких индексов — номеров узлов нет (см., например, приведен- 
ную выше табл.8.5), то за базовый для формулы (8.26) узел хо 
можно принимать узел, ближайший к заданной фиксированной 
точке х, если за ним имеется достаточное число узлов для по- 
строения необходимых для (8.26) разностей. Поскольку в первой 
формуле Ньютона используются нисходящие диагонали таблицы 
конечных разностей (см. табл.8.4), то такое смещение узла, при- 
нимаемого за базовый, в конце таблицы будет неприемлемо. 

Учет этого обстоятельства приводит к потребности в сим- 
метричной, в определенном смысле, для (8.26) формулы, которая 
была бы пригодной для интерполирования в конце таблицы. Для 
этого, в отличие от (8.23), форма интерполяционного многочлена 
Р,(х) берется такой, которая предусматривает поочередное под- 
ключение узлов в обратном порядке: сначала последний, потом 


предпоследний и т.д., т.е. 
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Р,(х) = ао наи )+й 
в аси ОЙ 3). 


Коэффициенты ао, а1,й , а» этого многочлена находятся анало- 


гично тому, как они находились для многочлена (8.23), только 
здесь подстановка узловых точек вместо х и рассмотрение ин- 
терполяционных равенств производится тоже в обратном поряд- 
ке. Полагая х=х„, ХЕХ, 1,Й , Имеем: 


Ри (хи) = а0 = Уи, 


Ра (хи) = Уп + а1 (Хи -хи) = Уи и 
Хи — Хи-1 й 


Аул 
Р‚(хи_2) = Уп + @-2 и + 42 (хи_2 —Хи Ххи-2 жит) = Ун-2 


2 
Уп-2 — Уи +2А уз _ Уп -2Уп + Уи-2 _ А Уи 


> @а2= = 
(хи — Хи Хх =н-) = 21 (- р) 2112 


ит.д. В общем случае 


ди У 
ау === УЕ Е{1,2,й ‚п}. 
КИ 
Таким образом получаем второй интерполяционный мно- 
гочлен Ньютона 


2 
ДУ. АГуи- 
Роб = ут ИН и) (и дих хи) +й 
2!й 


п 
й (ххх, 2-м), (8.27) 
п!й 
в котором базовым является узел х„ и коэффициенты которого 
определяются конечными разностями, расположенными на вос- 
ходящей от у, диагонали. 
Положим в (8.27) х=х, +ай, иначе, введем новую пере- 
а. 


менную 4 = " и преобразуем к ней входящие в (8.27) разно- 


сти: 
х-х; =х, +ай-х0д —И=хо + ий+ ай -хд -Ш=И(а+т-). 
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В результате приходим ко второй интерполяционной формуле 
Ньютона вида 


+1) 2 
1о) ы РЗ +91) = Уп +94А Уи А Ун-2 +й 
х НЫЙ я-Ь Оля, (8.28) 
п! 
Ее также целесообразно использовать при значениях |4|<1, 
т.е. в окрестности узла х„ Оля интерполирования назад 
(при 4 Е (-1, 0)) и экстраполирования вперед (при а > 0). 


Наряду с выведенными специально для начала и конца таб- 
лицы первой и второй интерполяционными формулами Ньютона, 
имеется еще несколько формул, рассчитанных на их применение 
в центральной части таблицы и потому называемых иентраль- 
ными интерполяционными формулами. Прежде, чем опреде- 
лять эти формулы, введем понятие центральных разностей. 

Будем считать, что узел хо расположен в середине табли- 
цы, и нумерация остальных узлов производится, начинаясь с х(, 
с использованием как положительных, так и отрицательных ин- 
дексов, т.е. считаем х; =хо +, где 1=0, +1, =2,й . Тогда цен- 
тральная часть таблицы конечных разностей будет проиндекси- 
рована так, как это показано в табл.8.7. Все подчеркнутые в ней 
конечные разности (находящиеся с хо, уд в одной строке и на 
полстроки выше и ниже) называются иентральными разностями. 

Интерполяционный многочлен ищем в форме 

Р(х) = ад +а1(х-хо)+а2(х-хо(х-м)+ 
(ела д-м)+ 


+ 44 (хх )(х- хо ххх х2) +В , (8.29) 
предполагающей постепенное подключение узлов х;: сначала 
при г =0, затем при 1=1, потом при 7 = -1 ит.д., т.е. с двух сто- 


рон от хо.При этом здесь и далее не будем фиксировать степени 
многочленов и не будем стремиться выписывать общие и, тем 
более, последние члены таких многочленов. Как и в предыдущих 
случаях, коэффициенты а; (К=0,12,й ) находим один за 
другим последовательной подстановкой в Р(х) и в интерполяци- 
онные равенства Р(х; )= у; значений х = ху, х|, Х_1, Хх, Х_о,Й 


4 

Ауд . _ Ау 7 _ Ау ь _ АУ 

к а А 
й 211? 313 41“ 


х—х 
и т.д. Введя новую переменную 4 а и выразив через нее 


ао = Уд; а = 
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разности х-х; =Й(а-1) для всех 1 = 0, +1, +2, Й ‚ в результате 
подстановки этих разностей и выражений коэффициентов в шаб- 
лон (8.29), приходим к первой интерполяционной формуле 
Гаусса: 


а(а-1) 


1(х) = Р(хо +41) = уд +АА уд + 7 А+ 
. (ее Ва. 9-м, , +1. (8.30) 


Записанные слагаемые легко дополнить следующими, если 
знать, что в этой формуле используются нижние центральные 
разности все возрастающих порядков, т.е. те, которые подчерк- 
нуты в табл.8.7 сплошной чертой. 


Таблица 8.7 


Таблица центральных разностей 


Совершенно аналогично, подключая узлы в другом порядке 
(после хо сначала предшествующий, затем последующий и т.д., 
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т.е. хо, Х1, Хр, Х_о,Й ), можно построить вторую интерполя- 
ционную формулу Гаусса 


15) = Р@хо +41) = Уд +4А У + 


РИО», МХ, ‚  @30 


использующую верхние центральные разности (подчеркну- 
тые в табл.8.7 пунктирной линией). 

Интерполяционные формулы Гаусса служат полуфабрика- 
тами для получения более симметричных, использующих все 
центральные разности интерполяционных формул. 

Так, полусумма первого и второго интерполяционных мно- 
гочленов Гаусса после преобразований приводит к формуле 
Ау1+Ауо 4 : 


Л (х) = Ру (хо +4й) = У +4 5 ТА + 


2 3 3 22 
(47-1) Му+А | 
— И. -— 1.94 : ИА , 


* 
называемой интерполяционной формулой Стирлинга ). 

Если же взять полусумму второго интерполяционного мно- 
гочлена Гаусса и такого же многочлена, но с нижними индекса- 
ми, увеличенными на единицу (т.е. с базовой точкой х| вме- 
* 

) 


и А 


‚ (8.32) 


= * 
сто хо), то придем к интерполяционной формуле Бесселя 


+ 1 
боя Роб ав) 29+ [9-ю + 


) 
2 2 а-= 99-1 
‚аа будь 2 1 3 


2! 2 оы 
4 4 
и аа . (8.33) 


В последней формуле обращает на себя внимание тот факт, 
что она сильно упростится, если в нее подставить значение 


1 = 1 
а= 5 соответствующее значению аргумента Хх = 5 +х1). 


* ’ 
) Стирлинг Джеймс (1692—1770) — шотландский математик. 
Е 


Бёссель Фридрих Вильгельм (1784—1846) — немецкий астроном, 
геодезист и математик. 
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Этот частный случай формулы Бесселя называют формулой ин- 
терполирования на середину: 


Е м У _1 Му+ Ао р 


2  & 2 


4 4 
Е Е, 


Итак, если точка х, в которой нужно найти приближенное 
значение таблично заданной функции Г(х), находится в начале 
или в конце таблицы, применяется соответственно первая 
(8.26) или вторая (8.28) формулы Ньютона с таким выбором ба- 
зовой точки, чтобы значение |4| было как можно меньше. Если 
точка х находится в середине таблицы, то всегда можно за- 
фиксировать точку хо в таблице центральных разностей так, 


Хх-^0 


чтобы 4 = либо было по модулю меньше 0.25 и тогда при- 


менять интерполяционную формулу Стирлинга (8.32), либо что- 
бы ЧЕ [0.25, 0.75] и использовать формулу Бесселя (8.33). 


Пример 8.4. Пусть требуется для функции у= Х(х), заданной в 
примере 8.3 таблицей нескольких своих значений с тремя знаками после 
запятой, найти приближенные значения: а) / (0.5); 6) /(1.22); 
в) /(1.5); г) /(.94); д) 1 (2.5), записав предварительно соответст- 
вующие каждому случаю интерполяционные формулы. 


Для решения поставленной задачи учитываем, что значения Г(х) 
заданы в примере 8.3 на сетке равноотстоящих узлов, поэтому 
здесь можно применить конечноразностную интерполяцию. При этом бу- 
дем пользоваться уже составленной табл.8.5 конечных разностей и прове- 
денным ранее ее анализом на выявление оптимальной степени многочле- 
на. Для случаев б-д фиксируем вторую степень, для а — третью. В 
каждом случае, т.е. для конкретного значения аргумента, выбираем базо- 
вый узел, подсчитываем значение вспомогательной переменной 4 и, в за- 


висимости от положения базового узла и значения 4, пользуясь представ- 
ленными в табл.8.5 числами, записываем требуемую интерполяционную 
формулу. Подстановка в нее значения 4 приводит к искомому значению 
Л(>). 

а) При х=0.5 (начало таблицы) полагаем хо =0.4; тогда 
х-х _ 0.5-0.4 
й 0.2 
лу для аппроксимации /(х) при х=0.4+0.24 с а=(-1,1) записываем, 

глядя на первую интерполяционную формулу Ньютона (8.26) и табл.8.5: 


Хоу= РИО +024) =0336-0.17904002 а -П+ ча -1Ха-2). 


= 0.5. Соответствующую интерполяционную форму- 
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Отсюда получаем искомое значение 


(0.5) = Р;(0.4+0.2.0.5) = 0.336- 0.179-0.5+0.031-0.5-(-0.5) + 
+0.0025-0.5.(-0.5)-(-1.5) = 0.336-0.0895-0.0078+0.0009= 0.240, 

6) Точка х =1.22 находится в средней части таблицы. Поэтому здесь 

целесообразно применить формулу Стирлинга или Бесселя. Полагая 

г х-хо 1.22-1.2 

хо =1.2 и найдя д=——— == ^^ =0.1, останавливаемся на формуле 

Стирлинга (8.32), которая в данном случае имеет вид 

0.040 + 0.119 0.079 › 


1) = Ру (1.2 + 0.24) = 0.040 + г р - 


и при 4 =0.1 приводит к искомому значению 
7.22) = 0.040 + 0.0080 + 0.0004 = 0.048. 


в) Здесь, очевидно, напрашивается применение формулы (8.34) ин- 
терполирования на середину. Полагая хо = 1.4, х| =1.6, имеем: 


1(1.5) = ее ы с | ее =0.256 — 0.0094 = 0.247. 


г) Глядя на положение точки х=1.94 в заданной системе узлов 
табл.8.5, видим, что для вычисления /(1.94) также возможно применение 


центральных интерполяционных формул. Положив хо =1.8 и вычислив 

х-хо 1.94-1.8 

В у, на основе (8.33) записываем интерполяцион- 
ную формулу Бесселя 


1х) = Рь(1.8+ од) бАО 0 +0334 0.5) 8070+0.068. + О 


Из нее получаем 
7.94) = Рь(1.8 + 0.2. 0.7) = 0.7915 + 0.0678 — 0.0072 = 0.852. 

д) Точка х = 2.5 расположена за последним узлом, поэтому для экс- 
траполяции /(х) здесь однозначно следует применить вторую интерполя- 
ционную формулу Ньютона (8.28). Считая х„=2.4 (индекс и здесь ис- 
пользуется условно, без придания ему конкретного значения), записываем 
формулу экстраполяции 


УС) = Р(2.4+0.24)=1.840+0.4724+.0:065 


9(4-+1), 


Х-хи _ 2.5-2.4 
ий 02 
(2.5) = Р(2.4+0.2.0.5) = 1.840 + 0.236 + 0.0244 = 2.100. 
В порядке обсуждения приведенного примера отметим сле- 


дующее. Во-первых, при записи интерполяционных многочленов 
не стоит приводить их к канонической форме, ибо тогда их чле- 


откуда при 4 = =0.5 находим 


360 


ны утратят ту информативность, которая в них заложена по по- 

строению и которая хорошо видна из рассмотрения промежуточ- 

ных результатов: налицо убывание роли слагаемых при подсчете 

каждого из значений а—д. Во-вторых, вычисление слагаемых ин- 

терполяционного результата нет смысла проводить более чем с 
х 


одним запасным знаком ), который в конце должен быть отбро- 
шен. Об этом говорят приближенность исходных значений и 
правила приближенных вычислений [3, 98, и др.]. Точность ре- 
зультата интерполирования принципиально не может быть выше, 
чем точность исходных данных. Вообще, о точности конечно- 
разностного интерполирования речь пойдет чуть ниже; здесь же 
заметим, что гладкость данной функции, плотность системы уз- 
лов и выбор подходящих параметров интерполяционных формул 
обеспечили в примере 8.4 вычисление всех требуемых значений, 
как нетрудно убедиться, с точностью не хуже 0.001, т.е. в грубом 
смысле все десятичные знаки результатов — верные. 


Теперь о том, как могут быть трансформированы остаточ- 
ный член и его оценки при конечноразностной интерполяции. 


В силу доказанной в $ 8.2 единственности интерполяцион- 
ного многочлена Лагранжа, все построенные здесь конечнораз- 
ностные интерполяционные многочлены Ньютона и Гаусса — 


%* 
это всего лишь различные формы его представления ). Следо- 
вательно, для всех этих форм справедливо выражение остаточно- 


го члена (8.12), где определенный посредством (8.10) многочлен 


Пи) для случая равноотстоящих узлов {х;}„_) преобразуется 


к новой переменной 4 = = следующим образом: 


И И 
Пи (©) = Пи (хо +4) = Со +ай- хо -М)= "ГП (а-9. 
1=0 1=0 
Отсюда 


(и-+1) 
у) = Вы ти ча-1й (а-"). (8:35) 
Итак, для /(х)ЕС те [а, 6] конечноразностная интерполя- 
ционная формула Ньютона или Гаусса степени п с базовым уз- 
лом хо может быть записана в виде 


* 
) При машинном счете эта рекомендация, разумеется, утрачивает 
смысл. 


*Ж* 
) По поводу формул Стирлинга и Бесселя см. далее замечание 8.1. 
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<) =Р, (хо +4й)+ В, (хо +ай), (8.36) 


где Р, (хо +4й) — тот или иной конечноразностный многочлен, 
построенный по равноотстоящим (с шагом Й) узлам 
хо, х,й , хи Е[а, В], а Ю,„(хо +41) — остаточный член (8.35), 
в котором & — некоторая неизвестная, но фиксированная (при 
фиксированном х) точка интервала (а, Б). 

Аналогично, при выборе базового узла х„, т.е. для второй 


интерполяционной формулы Ньютона, получаем точное пред- 
ставление 


Л(х) = Р‚ (хи +ай)+ Ки (хи + ай), 


(и-+1) 
о. а -+0й (а+п), а Ри(х, +4) — 


многочлен, определенный в (8.28). 


где А„(х„ +ай) = 


При наличии оценки ие) <М,.1 УхеЕ|[а,Ё| можно 


уточнить границы абсолютной погрешности конечноразностного 
интерполирования в конкретной точке и на всем промежутке 
[а, Ь] по типу (8.14), (8.15). 

Например, для оценки погрешности интерполяции в точке 


Хх =хо +ай на основании (8.36), (8.35) имеем”) 


|7) - Р,(х +41) < и" (4-"). (8.37) 


Если интерполяционная формула Х(х)= Р, (хо +ай) ис- 
пользуется для аппроксимации Г(х) в точке Х, расположенной 
достаточно близко к базовому узлу хо справа от него, т.е. если 
@Е(0,1), то оценку (8.37) можно существенно упростить. 


* 
) В силу отмеченной связи (8.21) между производными и конечны- 
ми разностями, очень грубо можно заменить М,„.| на величину 


А, } 
п-+1 


формацию об /(х), т.е. если степень и интерполяционного многочлена 
берется заниженной по сравнению с той, какой она должна быть для дос- 
тижения максимальной точности при конкретном порядке практически 
постоянных разностей. 


пах{ 
: ‚ если, конечно, разности де у; еще несут какую-то ин- 
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Это достигается применением неравенства 
| 
|9(а- п” (4-") <“ Уае (0,1) УпЕМ 


(читателю предлагаетя доказать его самостоятельно методом ма- 
тематической индукции). 

Подстановка последнего неравенства в (8.37) приводит к 
простой точечной оценке 


ю ы М С. 

ИС) - Р, (хо +21) < —"- "+1 (при йе (0,1)), (8.38) 
4 (п+1) 

подчеркивающей степенную зависимость точности интерполи- 

рования от малости шага таблицы. Если шаг й мал ис ростом и 


не происходит слишком быстрого роста | Х мые при хе (а, 5), 
то, как видно из (8.38), повышение степени и интерполяционно- 


го многочлена Р, (хо + 41) за счет множителя А”*! влечет умень- 
шение погрешности интерполяции (здесь имеется в виду только 
методическая погрешность, т.е. не учитывается точность задания 
значений функции и шум округлений). В этом случае можно го- 
ворить о точечной сходимости процесса конечноразностного ин- 
терполирования. 

С равномерной сходимостью дело обстоит сложнее. Суще- 
ствуют примеры бесконечно дифференцируемых функций, для 
которых максимальная погрешность при интерполировании на 
заданном отрезке по системе равноотстоящих узлов не стремится 
к нулю при и->% (й-›0). Таким примером служит функция 


* 
ог Ру ‚ впервые рассмотренная с этой целью Рунге ). Ус- 
+25х 
тановлено [3, 134, 142 и др.], что при ее интерполировании на 


отрезке [-1,1] по системе равноотстоящих узлов с шагом й == 
п 


многочленами Р, (х) имеет место 
т тах У В) = 
п->5о хе[-1, 1 


Завершая разговор о г ре интерполяции, от- 
метим, что наряду с уже построенными здесь интерполяционны- 
ми многочленами, можно строить ряд других. Для этого сущест- 
вует некая схема, называемая диаграммой Фрезера [19 и др.], 


* г 
) Рунге Карл Давид Тольме (1856-1927) — немецкий физик и ма- 
тематик. 
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включающая в себя известные интерполяционные многочлены и 
служащая источником получения новых, предполагающих ис- 
пользование зигзагообразных путей продвижения по таблице ко- 
нечных разностей. 


Замечание 8.1. Формулы Стирлинга (8.32) и Бесселя (8.33) лишь ус- 
ловно можно назвать интерполяционными. Это связано со способом их 
получения — суммированием с коэффициентами 0.5 действительно ин- 
терполяционных формул Гаусса. Легко видеть, что, например, в линейном 
случае получаемая в результате такого суммирования многочленов 


Ру(хо +ай)= уд +9Дуд и Б (хо +91) = уд + 9Ду_1 формула Стирлинга 
Ду + Дуо Я-У | 
у -50) В 

5 о 5р ( 0 ) 5 
определяется значениями данной функции у= /(х) в трех точках х_|, хо 
и х! (отсюда априори ее более высокая точность), но условие интерполя- 


ции выполняется лишь в одной из них, хо (рис. 8.2). Забегая вперед, ска- 
— лучше аппроксимирует /’(х), чем нь или 


(сравните (13.18) с (13.14) и (13.15)), т.е. формула Стирлинга 


Л(х) = у +4 


жем, что 
ПЕ 


ближе к формуле Тейлора, чем формула Гаусса или Ньютона, а значит 
многочлен Стирлинга лучше аппроксимирует функцию Х(х) в окрестно- 


сти точки хо. 


Хх № Хх 


Рис. 8.2. Геометрическая интерпретация многочлена Стирлинга 
первой степени. 


Формула Бесселя нулевого порядка 


У + 
Пя 
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определяется значениями функции у= /(х) в узлах хо их! и не является 
точной ни в одном из них; следовательно, многочлен Бесселя нулевой сте- 


У 
2 


пени РО = не удовлетворяет условиям интерполяции (8.3) и на- 


зывать его интерполяционным можно лишь в некотором более широком 
смысле. 


В связи с отмеченной особенностью формул Стирлинга и Бесселя, 
выделяющей их из множества других, эквивалентных интерполяционной 
формуле Лагранжа конечноразностных интерполяционных формул, для 
них должны применяться отличные от (8.35) формулы остаточных членов; 
их можно найти, например, в [19, 123]. 


8.6. ИНТЕРПОЛЯЦИОННАЯ ФОРМУЛА НЬЮТОНА 
ДЛЯ НЕРАВНООТСТОЯЩИХ УЗЛОВ 


Для построения интерполяционных формул, имеющих пе- 
ред классической интерполяционной формулой Лагранжа (8.6) 
преимущества, какими обладают конечноразностные формулы, и 
применимых в более общем по сравнению с последними случае 
произвольного расположения упорядоченных несовпадающих 
узлов хо, хр,й , х„ на промежутке [а, 6], вместо конечных раз- 
ностей используют разделенные разности, или иначе, разностные 
отношения. 

Через значения функции /(хо), /(х!), й , Г(х„) сначала 
определяют разделенные разности первого порядка: 


Не, 


7; м):= = 

И) а) 6). 
2-м 

ен: В: ые Ибн и). 


х,-х 
п п-1 
На этих разностях базируются разделенные разности второго 


порядка: 
ЛО; х2)- Лоо; м) 


х2 —^0 


. ББ Еф к: ЗИ я зы = 


Аый Ва га Аб Е 
) 
Хи  Хи-2 


Ух; хм; х›) = 


Аб Хи жы) = 
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и тд. Таким образом, если определены А-е разностные отно- 
шения Г(ххнй ухнь), то (К + 1-е определяются через них 
равенством 

Л@нихьй ;хнь)= 

_Лавхьый ухн-У@ььхнй ухньл) 
ХХ 

Легко проверить, что операция взятия разделенной разно- 
сти, как и в случае конечной разности, аддитивна и однородна, 
т.е. линейна. Кроме того, разделенная разность есть симметри- 
ческая функция своих аргументов, что позволяет у разделенной 
разности менять аргументы местами. 

Доказательство симметричности опирается на представле- 


ние А-й разделенной разности через значения функции в уз- 
лах, имеющее вид 


Ихвхный зхнь)= 


(8.39) 


Ив) (40) 


он нуну хной ну -Хна 


При А =1 справедливость выражения (8.40) очевидна: 


Иез НИР „Ино, ИЕ.) 


Ж+1 2 жом Мом 
Для произвольных натуральных К равенство (8.40) доказывается 
на основе (8.39) по индукции [19]. 
Важно отметить, что как и для конечных разностей, взятие 
разделенной разности многочлена понижает на единицу его 
степень. Это следует из рассмотрения разделенной разности 


УС; х-л) степенной функции /(х)=х”: 

И п 

: _ и М п—2 п-2 п-1 
хаха + ож +Й хех + 

| 
Отсюда приходим к заключению, что разделенные разности 
п-го порядка многочлена п-й степени 

—1 
Р‚(х)=арх" +ах"  +й +а,х+ая 


*) 
постоянны ‘. 


Следовательно, как и в конечноразностном случае, анали- 
зируя таблицу разделенных разностей (табл.8.8), по порядку 


* 
) Показано [19], что Р‚(хух+А:Й ;х+й,)=ад, а (п+1-е и все 
последующие разделенные разности равны нулю. 
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(9х1 7х)/ 
(Эх бхи хи Ех)/ 

(хех х) (ххх) 
(Ух Ех 1х) / 


(ких) (Рх хх) Г 
(Рхех сх Их) / 

(ххх 0х) / (ххх) 
(ххх: 0х) / 


(5х: 


пашронЕВА ханнаизоёра ойпкор 
$ ‘Зепикое | 
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почти совпадающих разделенных разностей можно сделать вы- 
вод о предпочтительной степени многочлена, подходящего для 
интерполирования данной функции. 

В основу построения интерполяционного многочлена по 
типу первого интерполяционного многочлена Ньютона (8.25), но 
для случая неравных промежутков между узлами х;, положим 
следующие рассуждения. 

Пусть Ф(х) — некоторая функция с известными значения- 
ми в узлах хо, х,й ‚ ах — произвольная фиксированная точка. 
По определению разделенной разности первого порядка имеем 


Ф(хо)- 9(х) _ (>) - Фо) 
Хо -х Хх - хо : 


Ф(х; хо) = 


откуда 


Ф(х) = Ф(хо) + Ф(х; хо)(х — хо). (8.41) 
Для разделенной разности второго порядка по точкам 
ЭХ Хо, Хх записываем представление 


Ф(хо; м) 905; хо) _ 05 хо) (хо; х1) 
х-х Хх -^| ’ 


Ф(х; хо; х1) = 


следствием которого является выражение 


Ф(х; хо) = Ф(хо; м1) + Ф(х; хо; м (хм). 
Подставляя его в (8.41), приходим к равенству 


Ф(х) = Ф(хо) + Ф(хо; м (х — хо) + Ф(х; хо; м1 (х — хо )(хф м). 


Формально, на основе определяющего разделенные разно- 
сти рекуррентного соотношения (8.39), этот процесс может быть 
продолжен. В результате можно записать формулу, описываю- 
щую своеобразное разложение ф(х) по произведениям разностей 
(х-—х;), коэффициентами в котором являются разделенные раз- 
ности различных порядков: 


Ф(>Х) = Ф(50) + Ф(х0; (Хх — хо) + ФС; Хи; х2)(х — хо)(х- х) +Й 
й оо хьй ух) -хо)й (хр + 
носок й мое кой Ч рб. (642) 
Если Ф(х)=Р,(х) — многочлен степени и, то процесс по- 
добного разложения исчерпывается. Разложение будет состоять 


из п+1 слагаемого, и все они будут иметь конкретные коэффи- 
циенты, так как последняя, содержащая х, разделенная разность 
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в (8.42), т.е. ФСхухо;й ;х„)=Р, (ху хо;й ;х,) имеет (п+1)-й 
порядок и, значит, равна нулю. Таким образом, для любого мно- 
гочлена степени и справедливо тождество 


Ри (х) = Р (хо) + Р‚ (хо; хи )(х — хо) + 
+ Р‚ (хо; ху; хо (х — хо (х- м1) +й 


й РОДаиЯ „Де де-кий аа). 


Предположим, что этот многочлен Р,(х) является интер- 
поляционным для некоторой функции Х(х). Тогда во всех узлах 
хо, хьй , х„ он должен иметь одинаковые с ней значения, а зна- 


чит должны быть одинаковыми и их разделенные разности. От- 
сюда приходим к интерполяционной формуле Ньютона для 
неравноотстоящих узлов: 


1 (>) = Р(х) = (хо) + (хо; хх хо) + 
+ Ло; хи; х2 (х- хо (хф- м) +й 
й + (хоз хьй ух, хх (Х-хй (хх). (8.43) 


Подставив /(х) вместо ф(х) в (8.42), с учетом (8.43) полу- 
чаем точное равенство 


Л) = Р,(х)+ Лоу хозй ; хх Ь-хо)й (х-х, (хи), 


второе слагаемое в котором может рассматриваться в качестве 
остаточного члена, т.е. 


Ки (х) — 1@)- РЁ (х) = 1; хо;й ‚Хи Тин (2 (8.44) 


где П„.1(х) — многочлен, введенный ранее посредством (8.10). 

Поскольку для вычисления разности /(х; хо;й ;х„) требу- 
ется знание значения /(х) наряду с известными значениями 
1 (<), й ‚, Г(х„), представляемое формулой (8.44) выражение 
В„(х) фактически можно использовать только для оценивания 
погрешности интерполирования по формуле (8.43) через макси- 
мальные величины модулей разделенных разностей (и + 1)-го 
порядка (если в них содержится достаточно незашумленной ин- 
формации) или для получения других выражений остаточного 
члена при тех или иных предположениях о данной функции. В 
частности, если функция /(х) имеет (и +1)-ю производную, то 
остаточный член (8.44) может быть преобразован к виду (8.12), 
согласно утверждению о единственности интерполяционного 
многочлена Лагранжа, одной из форм представления которого 
является (8.43). 
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При практическом использовании интерполяционной фор- 
мулы (8.43) приходится полагаться на убывание модулей слагае- 
мых в Р, (х) при увеличении номера слагаемого. Такое убывание 


обычно происходит до некоторых пор; затем начинается рост их 
модулей из-за влияния ошибок округления. 


Пример 8.5. Проследим процесс формирования результата интерпо- 


лирования функции /(х) =с0$(е` ^) в точке х= 0.3 с помощью несколь- 
ких ее приближенных значений, заданных на неравномерной сетке. Эти 
заданные значения и вычисленные по ним разделенные разности всех воз- 
можных порядков представлены в табл.8.9. 

Полагая в (8.43) х= 0.3, хо =0.2 и, далее, выбирая из табл.8.9 нуж- 
ные для применения (8.43) данные, получаем: 


(0.3) = 0.6831+0.4617-0.1-0.3134-0.1.(-0.2)+0.1317-0.1-(-0.2)-(-0.6)— 
—0.0382-0.1-(-0.2)-(-0.6)-(-1.1)+0.0080-0.1-(-0.2)-(-0.6)-(-1.1)-(-1.7) = 
= 0.6831+0.04617+0.00627+0.00158+0.00050-0.00018= 0.7378 
Найденное значение отличается от истинного значения со(е 03) не бо- 
лее, чем на 0.0001, что в условиях точности исходных данных в пределах 
0.00005 можно считать вполне хорошим результатом. Обратим внимание 


на предсказанное постепенное убывание роли последующих слагаемых в 
его формировании. 


Заметим, что при использовании разделенных разностей, 
как и при конечноразностной интерполяции, можно менять по- 
следовательность подключения узлов и получать интерполяци- 
онные формулы для неравных промежутков, отличные от (8.43), 
но имеющие такую же структуру. 


8.7. ОБРАТНОЕ ИНТЕРПОЛИРОВАНИЕ 


Под задачей обратного интерполирования понимается 
задача нахождения приближенного значения Х аргумента х таб- 
лично заданной функции /(х), соответствующего некоторому 
известному значению $ этой функции. При этом, естественно, 
предполагается, что у не совпадает ни с одним из данных значе- 
ний у; = Г(х;) (и значит, Х не совпадает ни с одним из узлов х;) 
и, В то же время, достаточно хорошо «вписывается» в таблицу 
значений у;. 


Для того, чтобы говорить о теоретически однозначной раз- 
решимости задачи обратного интерполирования, нужно потребо- 
вать выполнения основного условия существования обратной 


функции х = я (у) — монотонность данной сеточной функции. 
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Условимся далее считать, что такая монотонность имеет ме- 
сто либо во всей исходной таблице значений у;, либо в некото- 


рой ее части (используемой для решения обратной задачи). 

Так как функция у = /(х), вообще говоря, не может быть 
восстановлена точно по нескольким своим значениям (за опреде- 
ленными исключениями), то и обратная задача заведомо может 
решаться лишь приближенно. 

Формально простейший из приемов решения задачи обрат- 
ной интерполяции заключается в перемене ролями функции и ар- 
гумента и применения интерполяционной формулы Лагранжа, 
т.е. непосредственное вычисление Х по формуле (сравните с (8.6)) 


^ 
^ 
А 


бу) буду бу), (8.45) 
20 — хо) - Я (р -УнИб ув (и) 


М 


Такой подход обладает характерными для применений формулы 
Лагранжа недостатками (обсужденными ранее, см., в частности, 
$ 8.3) и привлекателен лишь в случаях, когда степень и интерпо- 
ляционного многочлена невысока и заранее известна. 


Например, им можно воспользоваться для следующего вывода 
метода обратной линейной интерполяции (иначе, метода хорд) реше- 
ния скалярных уравнений вида /(х)=0 (см. гл. 5). 


Пусть для непрерывной функции у= /(х) известны две точки 
хо, х! такие, что /(хо)- Л(х1) < 0, т.е. между ними имеется точка Х такая, 
что у;= /(Х)=0. Приближенно эту точку можно найти обратной линей- 
ной интерполяцией, подставив в (8.45) и=1и у=0: 


== 0— 
0-м ы я У т 
о Я - 0 


Обозначая правую часть этого приближенного равенства через х› и учи- 
тывая, что уд = /(хо), у1 = /(х1) ‚ полученному придаем вид 


а = хо) мо). 


(хи) - Л) 
На основе последней формулы (возможно, более узнаваемой в виде 
Ля Хм — хо) м 
хо = ) строится итерационный процесс получения по- 
Л )- 1%) 


следовательных приближений х;, к корню Х уравнения Г(х)=0 
(см. рис.8.3, а также рис. 5.4 и формулу 5.4). 
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Рис. 8.3. Приближения к корню Х уравнения }(х)=0 методом 
обратной линейной интерполяции 


Используя сразу большее, чем в предыдущем случае, количество 
точечной информации о данной функции /(х), т.е. подменяя функцию 
Г(х) интерполяционным многочленом Р,(х) достаточно высокой степе- 
ни, можно за один шаг найти удовлетворительное приближение к искомо- 


му значению #=ГТ (}) и, в частности, при }=0 с хорошей точностью 
найти корень уравнения /(х)=0. 


Если сопрягать точность получения искомого значения 


^ 


&=Л г: (2) с построением соответствующего интерполяционного 
многочлена подходящей (неизвестной заранее) степени, то для 
этой цели более пригодны интерполяционные формулы, в кото- 
рых можно постепенно наращивать точность за счет последова- 
тельного подключения все новых узлов. Рассмотрим, как это 
может быть реализовано в случае, когда информация об /(х) бе- 
рется на системе равноотстоящих узлов. 

Предположим, что число У близко к уд = /(х0), например, 
вписывается между уд и у| = Г(х1), и пусть известно достаточ- 
ное количество значений у; функции Г(х) в точках х; =хо + 
при 1 = 0,1, 2,й . Тогда за основу может быть принята первая ин- 
терполяционная формула Ньютона (8.26) с базовым узлом хо. В 
силу выдвинутого ранее требования о монотонности Г(х), иско- 
мая точка Х должна быть близка к хо; следовательно, прибли- 


женное значение Х будет найдено, если удастся найти такое (во- 
обще говоря, малое, укладывающееся в границы интервала (0, 1)) 


Хх-^хд 


значение = ‚ которое является приближенным корнем 
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уравнения 


и! 
Учитывая ыы уравнения (8.46), придадим ему вид 
задачи о И точке (6.3) 


7-7 _ Му А" Уо 
а= -а(а-1-й - (4-1 (ч-п+1. 
Ауд МАУ п!Ауо 

К последнему можно применить метод простых итера- 
ций (6.1), т.е. находить последовательные приближения а; ка 


по формуле 


5 2 
У В 
= у. 
м д тк. «(а -П- 


ак (ак 1 (44 -п+0 (8.47) 
= 


при А = 0, 1, 2,й , начиная с 40 = 2—2 . Степень и интерполя- 


А 

ционного многочлена здесь фаноаруноя в соответствии с пове- 
дением конечных разностей (не обязательно сразу максимальная; 
можно ее наращивать постепенно от итерации к итерации), а 
число итераций А, при котором следует положить 4 = ах опре- 
деляется практическим совпадением 4х с ах в пределах тех 
знаков, на которые можно рассчитывать при той или иной точно- 
сти и разреженности исходной дискретной информации об Х(х). 
После того, как при некотором А>1 будет принято 4 := 4х, счи- 
таем Х:= хо + ай. 

Для решения задачи обратной интерполяции можно соста- 
вить и другие аналогичные (8.46) уравнения с помощью подхо- 
дящих для того или иного случая разностных интерполяционных 
формул. Например, на базе интерполяционной формулы Ньюто- 
на для неравноотстоящих промежутков (8.43) можно построить 
итерационный процесс вычисления последовательных прибли- 


жений х`“”’ к искомому значению Х по формуле 


х(+ = в(х <); Е=0,12,й:; х(0) =>, 
где 
1 А 
ф(х) = хо Ио) + Л(хозмзх2 (х — хо (хх) 
(хоз) 
й + (хо; хий ; хи (х — хо (хм (хх). 
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Процесс подключения слагаемых в правой части, содержащих 
разделенные разности все более высоких порядков, здесь также 
может быть организован последовательным. 
Пример 8.6. Пусть известно несколько приближенных значений 
(хх 
функции д ОНИИ--я)) 


х 
ностей (табл.8.10). Требуется найти приближенно корень уравнения 


Л(х)=0. 


‚› И по ним построена таблица конечных раз- 


Таблица 8.10 
(х (+ х)) 


Таблица конечных разностей функции у = 


Полагая у=0, хо =1.2 и и=3, в соответствии с формулой последо- 
вательных приближений (8.47) и данными табл.8.10, находим: 


Е 0-(0.046) = 0.430; 
0.107 
Ч! = 0.430- 20-023) ( 430.(0.430—1)- ВР -0.430-(0.430—1)(0.430-=2) = 
2.0.107 6.0.107 
= 0.430-0.026-0.004= 0.400; 
42 - 0430-20-02) (.400.(0.400—1)- ее - 0.400: (0.400—1)(0.400-2) = 
2.0.107 6.0.107 


= 0.430—0.026-—0.004= 0.400. 


Совпадение 42 с 41 в третьем знаке после запятой говорит о том, что 
можно принять 4:42 = 0.400. Учитывая, что й=0.1, в силу связи 


1 (х ш(+х)) 
х 


Х = хо + ай, корень уравнения = 0 считаем равным 


Х=1.2+0.400.0.1=1.240. 
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8.8. ИНТЕРПОЛЯЦИЯ С КРАТНЫМИ УЗЛАМИ 


Рассмотрим задачу полиномиальной интерполяции функ- 
ции у = 1(х) в более общей постановке. 

Пусть на промежутке [а, В] < О(Ф) расположены т +1 не- 
совпадающих узлов хо, х,Йй ‚хи, и пусть в этих точках извест- 
ны значения уд = /(х0), у=/()й , Уш=У(и) данной 
функции, а также некоторые ее производные (максимальный по- 
рядок производных в разных узлах различен; в каких-то узлах 
производные могут быть вовсе неизвестны). Такие узлы будем 
называть кратными узлами. Конкретнее, будем считать, что за- 
даны: 


в узле хо значения уд, уд,Й О, 


и , Р (1) 
узле х| значения У, Ур,й ‚У ›, (8.48) 


, („-—). 
в узле х„ значения у, уш,Й ‚Уш” ›; 


тогда кратность узла х( считается равной Кд, узла х| — А, ..., 
Узла хи — Ки. 
Предполагая, что суммарная кратность узлов есть 
КЮ +Я-+йЙ + =п+1, (8.49) 
ставим задачу построения многочлена Н»„(х) степени и (не вы- 
ше п) такого, что 
Нд) =у УЕ, В ‚,т} У ле, Ьй ‚К, -1, (8.50) 


где т>0, У? = ре — заданные посредством (8.48) значе- 
ния функции /(х) и ее производных и по определению считается 
Н®)(х,) = (0) = у;. Многочлен Н„(х) будем называть 


* 
интерполяционным многочленом Эрмита ) а совокупность 


требований (8.50) — условиями эрмитовой интерполяции. 
Формально можно считать, что нахождение такого много- 
члена состоит в том, чтобы однозначно определить и+1 коэф- 


фициентов а, а1,й , а» его канонического представления 


* , 
) Эрмит Шарль (1822—1901) — французский математик. Принятое 
обозначение многочлена Н„(х) связано с французским написанием фа- 
милии Негтие. 
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Ни(х)=адх" +ацх" | +й +а,х+ал (8.51) 


из условий (8.50). В силу предположения (8.49) о суммарной 
кратности узлов эрмитовой интерполяции, совокупность требо- 
ваний (8.50) можно рассматривать как систему из и+1 уравне- 
ний относительно и-+1 неизвестных — коэффициентов ах мно- 
гочлена (8.51): 


Ни(хо) =; Ни) =; Й НЭ) =000; 

Ним) =75  Н,б) = й На) =, 
..о 9 Ув й ..о 

В) = Ут, Я = Ут; й НП (хи) 5"). 

Единственность многочлена Н„(х), удовлетворяющего ус- 
ловиям эрмитовой интерполяции, доказывается, как обычно, от 
противного. А именно, если Н„(х) и Н„(х) — два многочлена 
степени и, удовлетворяющие одним и тем же и+1 условиям 
(8.50), то это означает, что многочлен-разность Н„(х)-Ни(х) 
степени не выше и имеет и+1 корень (с учетом кратностей), 
следовательно, Н„(х)-Н„(х)=0, отсюда — совпадение Н„(х) 
и Я, (х). 

Существование многочлена Н„(х), удовлетворяющего тре- 
бованиям (8.50), можно вывести из его единственности. Дейст- 
вительно, возьмем в качестве исходной функции у = Х(х) функ- 
цию у= 0. Все ее значения и значения производных равны нулю, 
поэтому условия (8.50) для нее имеют вид 


НЙ (х,)=0, (8.52) 
и таких условий п+1. Получается, что многочлен и-й степени 
Н„(х) имеет п +1 корень (с учетом кратностей); значит, это есть 


нуль-многочлен. А это означает, что все а; в его выражении 
(8.51) равны нулю. С другой стороны, (8.52) — это однородная 
система линейных алгебраических уравнений относительно ко- 
эффициентов а’, которая, в силу единственности такого набора 
ах, имеет только тривиальное решение. Отсюда следует нера- 
венство нулю ее детерминанта, влекущее разрешимость такой 
системы при любых правых частях, т.е. формальное существова- 
ние наборов коэффициентов а, (К=0, 1,й ‚ п), обеспечиваю- 
щих выполнение условий эрмитовой интерполяции (8.50) для 
любой заданной с помощью (8.48) функции у = Х(х). 
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Выявление общего вида интерполяционных многочленов 
Эрмита Н„(х) представляет непростую задачу и требует при- 
влечения определенных сведений из теории функций комплекс- 
ной переменной [129 и др.]. Рассмотрим одну из возможных 
процедур фактического построения таких многочленов, не тре- 
бующую знания их общего вида (см., например, [19]; другой 
способ можно найти в [158]). 

Пусть Ё„(х) — интерполяционный многочлен Лагранжа, 
построенный по данным т+| значениям у; = Х(х;), 
1=0,1)й ‚т. Как и ранее (см.(8.10)), будем пользоваться обо- 
значением Пи.1(х):= (х- хо)(х- м)й (х-хи). Так как по ус- 
ловию и заведомо не превосходит и, то по теореме о делении 
многочлена с остатком искомый многочлен Эрмита Н»„(х) 
можно представить в виде 


Н,(х) = ы(х)+Н, (ин) (*)-Пьн (<), — 853) 


где Н»„(и+1(Х) — некоторый неизвестный пока многочлен 


степени и- т-1. 
Для построения многочлена Н п-—(м +19 (х) будем привлекать 


информацию о производных данной функции, т.е. равенства 
Н,(х,) = у; в тех узлах х;, где первые производные, в соответ- 
ствии с (8.48), заданы (информация о самих значениях функции 
уже полностью исчерпана: в силу Г„(х;) = у; и Пи-1(х;)=0 для 
всех х; от хо до хи, согласно (8.53), будет и Н„(х;)=у; при 
любых {= {0,й ‚т}). 

Продифференцировав равенство (8.53), имеем 


Нь(х) = Гт(х)+ Ни-(т+1) (х)-Пи-1 (©) + Ни—(т+1) (х)- Пин (х). (8.54) 


Поскольку Пи.1(х;)=0, в тех узлах х;, где по условию эрмито- 
вой интерполяции справедливо Н’, (х;) = у;, можно записать 


т (х ре (тз1) (х х;) Пина (х;) = У. 


Отсюда выражаем значения многочлена Н„_(т1)(х) в этих уз- 
лах: 


т. у: = Е ) 
)- Пи +1(хр) | 


Правая часть этого равенства может быть вычислена; обо- 
значим ее через 2;. Таким образом, в ряде узлов х; известны зна- 


чения многочлена Н„_(м+1)(х:)=2;, по которым этот многочлен 


Ни- (т+) С: 
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однозначно восстанавливается обычной лагранжевой интерполя- 
цией, если в условиях (8.48) не содержится производных поряд- 
ка, выше первого (т.е. нет ни одного узла кратности больше 1); 
подстановка найденного многочлена Н»„_(т-1)(х) в (8.53) приво- 


дит к искомому интерполяционному многочлену Эрмита. Если 
же в исходной информации (8.48) об Г(х) имеются значения 
производных более высокого порядка, чем первый, то для вос- 
становления многочлена Н»(т+1)(х) ставится задача эрмитовой 


же интерполяции, для чего наряду с полученными его значения- 
ми 2,, находят значения его производных путем дифференциро- 
вания равенства (8.54) (возможно неоднократного, в зависимости 
от максимального порядка заданных производных функции 
7(>)). Эта процедура построения интерполяционных многочле- 
нов Эрмита все более низких степеней продолжается до исчер- 
пывания всей информации (8.48) о функции и ее производных. 

Рассмотрим реализацию описанного процесса эрмитовой 
интерполяции на простом примере, демонстрирующем возмож- 
ность восстановления многочлена и-й степени по его значениям 
и значениям некоторых его производных при суммарной кратно- 
сти узлов и +1. 


Пример 8.7. Пусть сведения о некоторой функции у= /(х) пред- 
ставлены следующей дискретной информацией: 


В соответствии с обозначениями (8.48) здесь: т=2; Ко -1=1, 
Ж-1=2, К -1=1 > и+1=Ад+А +А› =7 => И=6б. Таким образом, 
по данным сведениям о функции у= Г(х), сосредоточенным в трех узлах 
хо =-1, л1 =0, х> =1 кратности, соответственно, 2, 3, 2, следует строить 
интерполяционный многочлен Эрмита Нб(х). 

Согласно предложенной выше схеме, сначала, пользуясь столбцами 
х;, у; таблицы данных, записываем интерполяционный многочлен Ла- 
гранжа второй степени 


Мх-=). -©+0е-1. + +Их. 


СПС2) 1.1 Г 


12(х)= 0=1-х2. 


379 


Далее по формуле (8.53) представляем Но(х) через 1[5(х), Нз(х) и 
Пз(х): 

Не (х)= 12 (х)+ Нз(х)-Пз(х)=1-х? +Нз(х(х+х(х-1), (8.55) 
и дифференцируем этот многочлен дважды: 

НЕ (х)=-2х+ 2 1) ++ хх -9 3); 

Не (х)=-2+6х-Нз(х)+2 3х2 169+ +0 -9Н509. 
Подстановкой в Нь(х) значений х=-1, х=0 и х=1 и приравниванием 
Не(х;) заданным значениям у’ получаем значения Нз(х;): 

при х=-1 Н&(-1)=2+2Н3(=0=-2 => Нз(-)=-2; 

при х=0 1% (0)=0-Н:(0)=0 > Н:(0)=0; 

при х=1 Н&()=-2+2Н3()=2 > Нз@=2. 
Учитывая их, из условия Не (0)=-4, т. е. из -2-2Н\(0)=-4, находим 
Нз(0)=1. 

Итак, для выявления многочлена Нз(х) в (8.55) снова имеем задачу 


эрмитовой интерполяции с данными, содержащимися в следующей 
таблице: 


Здесь: т=2; Ку =1, А =2, А =1 > п=3 > п-(т+1=0. В соот- 
ветствии с (8.53), для этого случая записываем: 


- х(х-1) (х+0@<-1) (х+0х 
Нз(х)= То (х)+ Но Па (= (- 2). 0+ —.2+ 
5 = 6д+ Но ПЕС = 
+Но -(х+ха-=2х+ (2 о 
(где Г. (х) — многочлен Лагранжа, интерполирующий функцию Нз(х)). 
Остается найти постоянную Но, для чего воспользуемся условием 
НУ(©)=1. Имеем: 
НУ (®=2+ (6х2 -ПНо => 2+6-.0-ЮНо=! => Но=1. 
Следовательно, 
Но =2х+х(х? —1)-1=х3 Е: 


Подставив это в (8.55), получаем окончательное выражение искомого 
многочлена: 


Нв(х) =1-х2 + (5 хх -х)= х6 25241, 


Легко убедиться, что исходная таблица была составлена именно для 
этой функции. 
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В заключение отметим, что для (и -+1)-кратно дифференци- 
руемой функции /(х) остаточный член интерполяционной 
формулы Эрмита имеет вид [19, 123, 169] 


1+1 (Е) 1 р Е, 
Под Нек -ядАя (ил), (850) 
где Ко +К +й +К,„ =и+1 — суммарная кратность узлов 
х0,^1,й ‚хи, а & — некоторая точка из промежутка 


[а, ]5[х,хт|. Характерно, что в случае, когда все узлы — 
простые (однократные), т.е. т=и, интерполяционный много- 
член Эрмита есть не что иное, как обычный многочлен Лагранжа 
Г, (х), и остаточный член (8.56) совпадает с выведенным ранее 
его остаточным членом (8.12). Если же вся информация об Х(х) 
сосредоточена в одном узле хо, т.е. хо является узлом кратности 
п+1, то многочлен Эрмита — это просто многочлен Тейлора с 


+ (2) пы 
у @-9) 


остаточным членом 


УПРАЖНЕНИЯ”) 


8.1. Для функции ХГ(х), заданной тремя значениями /(1)= 0.71, 
1(2)=3.31 и (3) =0.18, найдите коэффициенты интерполирующего ее 


многочлена Р(х)= а +ах+ арх? непосредственно из условий интерпо- 
ляции. 


8.2. Привлекая интерполяционные соображения, докажите, что вы- 
ражение 
(х-Б)(х- <), (х-а)(х- о, (х-а)(х-Ь) 


(а-Ь{а- и (Б-а\{ь- в” (е-а(-Б) 


тождественно равно 1 при любых попарно различающихся а, Бис. 


8.3. Дана таблица значений функции у = 1х: 


х, п 12 13 14 15 
У | 1.0414 | 1.0792 | 1.1139 | 1.1461 | 1.1761 


А) С помощью линейной интерполяционной формулы Лагранжа вы- 
числите 1511.6 (= [1(11.6)), оцените погрешность и сравните ее с факти- 
ческой ошибкой. 


* 
) Предполагается, что все фигурирующие в упражнениях функции 
обладают нужной гладкостью. 


381 


Б) С какой точностью можно вычислить по этим данным 111.6 по- 
средством интерполяционной формулы Лагранжа третьей степени? Запи- 
шите расчетную формулу для вычисления 1211.6 = [3 (11.6). 

В) Можно ли в данных условиях построить интерполяционный мно- 
гочлен пятой степени? 


8.4. Пользуясь интерполяционной схемой Эйткена, пополните таб- 


лицу 
х 2.0 21 2.2 2.3 2.4 2 
У 10.3010 0.3424 0.3802 | 0.3979 
недостающими значениями у(2.1) и у(2.3). 


8.5. Какую точность можно гарантировать при линейной интерполя- 


ции функции у=хе ^ на отрезке [0, ||, считая узлами интерполяции его 
концы? 


8.6. Двумя способами восстановите многочлен Р;(х) по его значениям 
ре —1 0 1 2 


8.7. По данным упражнения 8.3 постройте таблицу конечных разно- 
стей. Вычислите по интерполяционным формулам Ньютона приближен- 
ные значения 1211.6, 1510.5, 1214.5 и 1515.2. Сравните их с точ- 
ными значениями. 


8.8. Применяя наиболее подходящие центральные интерполяцион- 
ные формулы, найдите значения у(1), (1.12) и у(1.5), если соответствие 
между х и у= у(х) задано таблицей 


а 0.1 0.5 0.9 1.3 1.7 2.1 
на 0.000 | 0.100 | 0.354 | 0.734 | 1.189 | 1.676 ` 


8.9. В каких точках выполняется условие лагранжевой интерполя- 
ции: 

а) для многочлена Бесселя второй степени, построенного по точ- 
кам хр, хо, хр, № ? 

6) для многочлена Стирлинга третьей степени, построенного по точ- 
кам х_2, Хх, Хо, м, Хо ? 

8.10. По аналогии с формулой (8.43) выведите вторую интерполяци- 
онную формулу Ньютона, пригодную для интерполирования по нерав- 
ным промежуткам в конце таблицы значений сеточной функции. 


8.11. Для функции Х(х), заданной таблицей 
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составьте таблицу разделенных разностей, запишите подходящие для вы- 
числения /(0.6), (1.5) и Г(3) конкретные интерполяционные многочле- 
ны и найдите эти приближенные значения. 


8.12. Докажите, что в примере 8.6 (см. $ 8.7) выполняются достаточ- 
ные условия сходимости итерационного процесса (8.47). 


8.13. Некоторая зависимость у = у(х) задана следующей таблицей: 


х 1 7 13 19 25 
У 10.21361 | 0.40541 | 0.85225 | 1.79725 | 3.78183 ° 


Обратным интерполированием установите, каким значениям х отвечают 
значения у = 0.3178 и у=1.159. 


8.14. Найдите многочлен Р(х), данные о котором представлены сле- 


дующей таблицей: 
х | Ро) | Р'&) | Р"(х) 
—1 
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ГЛАВА 9 |МНОГОЧЛЕНЫ ЧЕБЫШЕВА И 
НАИЛУЧШИЕ РАВНОМЕРНЫЕ 
ПРИБЛИЖЕНИЯ 


Дается определение многочленов Чебышева первого рода и 
изучаются их свойства. Показывается, что погрешность ин- 
терполирования гладкой функции многочленом фиксированной 
степени будет наименьшей, когда в качестве узлов интерполя- 
ции используются корни многочленов Чебышева. Приводится 
(без доказательства) теорема о чебышевском альтернансе, 
служащая теоретической основой построения наилучших рав- 
номерных приближений, и рассматриваются простейшие си- 
туации, когда такие многочлены могут быть построены. Об- 
суждается идея использования разложения функций в 
степенные ряды для получения многочленов, близких к многочле- 
нам наилучших равномерных приближений. 


9.1. ОПРЕДЕЛЕНИЕ И СВОЙСТВА 
МНОГОЧЛЕНОВ ЧЕБЫШЕВА 


Определение 9.1. Многочленом Чебышева”) называ- 
ется функция 


Т, (х) := соз(пагссозх), (9.1) 
где пе Му, хЕ[-1,1]. 


Прежде всего, убедимся, что функция Т,(х), представлен- 
ная с помощью тригонометрических функций, на самом деле яв- 
ляется многочленом при любом и = 0, 1,2,й. 

Непосредственной подстановкой в (9.1) значений п=0 и 
п=1 получаем Ту(х)=1, Т,(х)=х. 

Положив @ := агссо$ х, имеем: 

Т,(х)=соз&, Т,„(х)=созпа, 


Т,1(х)= соз(п -Па, Т„.и(х)= соз(и + а, 


*) Чебышёв Пафнутий Львович (1821-1894) — знаменитый русский 
математик. Его работы о многочленах наилучшего равномерного прибли- 
жения легли в основу конструктивной теории функций. Стандартное обо- 
значение Т,(х) можно соотнести с немецким написанием фамилии 
Тзсвебузспе\ум. 
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и так как (по формуле суммы косинусов) 
со$(и + 1)а + соз(и — Т)а = 2с0$&соз па, 
то, значит, справедливо равенство 
Тр (х) + Ти (х) = 21| (х)т, (х), 
которое может быть переписано в виде 


Ти (х) = 2хТ„(х) - Ти-1 (>). (9.2) 


Формула (9.2) определяет при и=1, 2, 3Й последователь- 
ность функций Т,(х), начинающуюся с То(х)=1, Т,(х)=х, 
рекуррентно; при этом нужно иметь в виду, что здесь 
хЕ[-1, ||, как ив (9.1). 

Подставляя в (9.2) заданные начальные члены последова- 
тельности (Т, (х)), найдем несколько ее последующих членов: 


Т› (х)=2х? —1; 
Т3(х) = 2х(2х? -1-х = 4х3 —3х; 
Т4(х) = 2х(4х3 —3х)- 2х2 +1=8х4 — 8х2 + [ 


Т5(х) = 2х(вх“ 7 1) 4х3 +3х =16х° —20х3 +5х 


ИТ. Д. 
Графики нескольких многочленов Чебышева (с первого по 
четвертый) изображены на рис. 9.1. 


Рис. 9.1. Графики многочленов Т\(х), Т>(х), Т-(х) и Т4(х) 


Анализ рекуррентной формулы (9.2) позволяет считать оче- 
видными следующие факты: 


1) все функции Т„(х), определенные в (9.1), являются мно- 


гочленами при любом натуральном п; 
2) степени этих многочленов возрастают с увеличением п, 


причем старший член многочлена Т„(х) равен ТЯ ; 
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3) многочлены Т„(х) при четных п выражаются через 
степенные функции только четных степеней, при нечетных — 
только нечетных. 

Наряду с многочленами Чебышева Т,(х), часто используют 
многочлены, получаемые из Т,(х) делением на старший коэф- 
фициент, т.е. 

1 


я) п-1 


7, (х) = Т,(х) 


— многочлены со старшим коэффициентом 1. Будем называть их 
нормированными многочленами Чебышева. 


Многочлены Чебышева обладают рядом замечательных 
свойств. Рассмотрим некоторые их свойства, имеющие отноше- 
ние к поставленной выше проблеме аппроксимации функций. 


Свойство 9.1. Многочлен Чебышева Т,„(х) (а значит, 


и многочлен Т,(х)) имеет на отрезке [-1, | ровно п раз- 
личных действительных корней; все они задаются форму- 
лой 
2+1 
ии. бане Е-Ь ‚п-1. (9.3) 
п 


Доказательство. Корни многочлена Чебышева Т,(х) 
можно получить, решая тригонометрическое уравнение 


со5(и агссозх) =0. 
Имеем: 


_п 


2+1 
ИИА <> ассозх= Л. 


2п 

Поскольку главные значения арккосинуса должны принадлежать 
промежутку [0, л], целая переменная А здесь должна принимать 
значения от 0 до и-1. Переходя на этом промежутке к обратной 
функции, иначе, беря косинус от левой и правой частей послед- 
него равенства и учитывая, что с0$ агссо$ х =х, приходим к вы- 
воду, что и действительных корней многочлена Т,(х), опреде- 
ляемые формулой (9.3), на самом деле существуют. Их 
несовпадение и принадлежность отрезку [-1, 1] следует из того, 
что они суть значения косинуса, соответствующие раз- 
личным значениям его аргумента, расположенным на промежут- 
ке его монотонности. 
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Свойство 9.2. Корни многочленов Чебышева пере- 
межаются с точками их наибольших и наименьших значе- 
ний, равных соответственно +1 и -1 для Т,(х) и 


1 1 
И — 


ы 27-1 27-1 


для Т,(х). А именно, при }=0,1,й ‚п 


имеют место экстремумы 


в точках х; = соз-^л. (9.4) 
п 


 ш (-1)/ 

т, (*;)=С1/, 1,(,)= а 

Доказательство. Из определения многочлена Т,(х) 

формулой (9.1) следует, что |Т,(х)] < 1. Покажем, что максималь- 

ное значение 1 для |Т,(х)] достигается, т.е. существуют такие 
точки хЕ [-1, ||, в которых |7, (х)|=1. Имеем: 


Т,(х)==1 <> с05(пагссозх)=+1 > 
пагссозх=л] (1Е 2) <> агссозх = (Е 2). 
и 


Число /л принадлежит отрезку [0, л], т.е. может служить зна- 
п 


чением арккосинуса, если /Е{0,1,й ‚ и}. Следовательно, урав- 
нение | 7, (х)| =1 имеет своими корнями и + | точек 


х, =с05-л, = й в. (9.5) 
Что эти точки экстремумов многочлена 7Т„(х) перемежаются с 


2 
его корнями, легко увидеть, переписав (9.5) в виде х; = сов 
п 
и сравнив это с (9.3). Факт чередования максимумов и миниму- 


мову Т„(х) следует из того, что значения выражения пагссозх в 
точках х;, согласно промежуточному равенству пагссозх =л/, 
равны поочередно 0,л,2л,3л,й ‚, и потому, в зависимости от 
четности /, значения с05(иагссозх) будут соответственно 
то +1, то —1. 


Свойство 9.3 (теорема Чебышева). Из всех много- 
членов степени п со старшим коэффициентом 1 нормиро- 


ванный многочлен Чебышева Т,„(х) наименее уклоняется 
от нуля на отрезке [-1, ||. 
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Доказательство (от противного). Пусть существует 
многочлен Р,(х)=х" +ах"\+й +а, такой, что 


= ^ 1 
тах |Р,.(х)< тах |Т, (х = по свойству 9.2). 
„тах " „тах " ) ( 27-1 те 


Разность этих двух многочленов, очевидно, есть многочлен сте- 
пени, не выше и -—1; обозначим его 


0, 1@&)=7Т,@&)- ВР.) = ых" Их" 2 +В +Ь,. 


Пользуясь тем, что график Т,(х) лежит в полосе, ограниченной 


1 ы = 
прямыми у= = т’ чередуя касания то верхнеи, то нижнеи из 
ий 


этих прямых (по свойству 9.2), а график Р,(х) при хе[-1, | 
должен лежать строго внутри этой полосы (по предположению), 
то можно утверждать, что многочлен-разность О„_1(х) в точках 


экстремумов х; = созл должен иметь определенные знаки: «+» 
п 
при четных / и «—>» при нечетных / (рис. 9.2). 


Рис. 9.2. Возможное совместное поведение 
графиков Т,(х) и Р,(х) 


Поскольку Т,(х) на [-1, || имеет и +1 таких точек экстремумов, 
следовательно, многочлен О„_1(х) должен иметь, по меньшей 
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мере, и перемен знаков, т.е. и корней, что противоречит следст- 
вию из основной теоремы алгебры многочленов. Полученное 
противоречие говорит о несостоятельности сделанного в начале 
доказательства предположения. 


Только что доказанное свойство означает, что среди всех 
многочленов степени п вида 


Р‚(х)= х"+ах" 1 +й +ал (9.6) 


именно нормированный многочлен Чебышева й (х) минимизиру- 
ет максимальное расстояние от графика многочлена при 
хЕ[-1,1] до оси абсцисс, т.е. Т,(х) — это многочлен с наи- 
меньшей нормой (так называемой чебышевской нормой) на 
множестве многочленов вида (9.6) в пространстве С[-1, |. 


Замечание 9.1. Иногда бывает более удобным использовать сме- 
щенные многочлены Чебышева у (х), которые определяются на отрезке 
[0, | и могут быть получены из классических многочленов Чебышева 
Т, (х) заменой в них аргумента х на аргумент 2х-1. 


9.2. ИНТЕРПОЛЯЦИЯ ПО ЧЕБЫШЕВСКИМ УЗЛАМ 


Вернемся к изучавшейся в предыдущей главе задаче 
интерполяции. 

Сравнивая конечноразностные интерполяционные много- 
члены, построенные по системе равноотстоящих узлов, с интер- 
поляционным многочленом Лагранжа, предполагающим произ- 
вольное расположение несовпадающих узлов на промежутке 
интерполирования [а, Б], следует отметить, что первые более 
просты и удобны в использовании, вторые же обладают ббльши- 
ми возможностями. Нет сомнений в том, что если можно распо- 
лагать узлы в пределах отрезка [а, Ь] как угодно, то имеет смысл 
использовать большее количество точечной информации о 
функции там, где она более сильно изменяется. Особенно суще- 
ственным это замечание может оказаться при эрмитовой интер- 
поляции. 

Подойдем к проблеме расположения узлов интерполяции с 
несколько иной стороны. 

Желая, чтобы интерполяционный многочлен Лагранжа 
Г (х) (8.6) в целом хорошо приближал функцию у = Х(х) на от- 


резке [а,Ь], поставим вопрос: как расположить на нем и+1 
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узлов интерполяции х; (1=0,1,Йй ‚п), чтобы при этом мини- 
мизировать максимальную на [а, 6] погрешность? 


Поскольку, согласно (8.15), 


„тах |6) - (< о мих, х [Пи (9.7) 


и величина М,„.|:= ми не зависит от расположения 
хЕа,Ь 


узлов, займемся изучением определенного в (8.10) многочлена 
Пи-1 (<). 
Сначала выполним одно простое преобразование независи- 
мой переменной, которое неоднократно будет использоваться и в 
дальнейшем. А именно, положим 
а+Ь Ь-а 
х = ЕЕ та 
2 2 
Легко видеть, что эта линейная замена осуществляет взаимно- 
однозначное соответствие между хе[а,Б] и (=[-1,1. 
Благодаря (9.8) узлам х; е [а, В] можно сопоставить точки 


Е [-1, ||, полагая 


(9.8) 


а+ь Ь-а 
Х; = + 7: 
2 2 
Тогда образующие П„.1(х) сомножители х-х; преобразуются 
по формуле 


= 


и, следовательно, 


п) = Йе-хд-(* “ео 


[южн ((-„). (9.9) 


Из (9.9) явствует, что значение тах |П„.1(х) будет мини- 
ха, В 


мальным, когда будет минимальным значение тах п р +1(], где 


Пи) =(-ю)-и)й (-1,) 
— многочлен и+1| степени, в котором точки ЁЕ[-1, |] 
(1=0,1, й ‚ п) считаем параметрами. Так как коэффициент при 
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старшей степени многочлена П„.1(/) в его каноническом пред- 
ставлении равен 1, то, в силу свойства 9.3, величина 


тах |П„.1(#) (а значит, и тах |П„.1(х)) будет минимальной в 
1&[-1, хе[а, 6] 


том случае, когда П„.1(1) есть нормированный многочлен Че- 
бышева Т„.1(1). 


Таким образом, полагая П„.1(#)=7,.1(1), имеем: с одной 
стороны, точки 4, 1,й , („ по замыслу являются узлами интер- 
поляции (для переведенной задачи интерполяции с исходного 
отрезка [а,Ь] на отрезок [-1, 1]), с другой стороны, в силу 
структуры многочлена П„.1((), они служат его корнями, а зна- 


чит, и корнями 7.1 (Е). Отсюда — вывод: 


максимальная погрешность интерполирования достаточно 
гладкой функции на отрезке [-1, {| многочленом п-й степени 
будет минимальной, когда в качестве узлов интерполяции 
1, 1,Й , и Е[-1, 1] берутся корни многочлена Чебышева Т„.1(!) 
(как известно, совпадающие с корнями Т„-1(#)). Будем называть 
их чебышевскими узлами интерполяции. 


Знание экстремальных значений многочлена Чебышева 
(см. (9.4)) позволяет уточнить величину максимального отклоне- 
ния /„(х) от /(х) при таком выборе узлов, т.е. когда точки (; 


ве РА, 1=0, и) есть корни 7,1 (1), ах; = жи: + а: 
2п+2 2 


1. 


^ 1 
А именно, так как тах | (6) = —, то, согласно (9.9), 
«[-Ь оп 


т пп [25%)" (а) 


хе[а,ь 2 оп и 2271 
подставляя это в неравенство (9.7), получаем 
М ( = де 
тах р 9.10 
ах ) м й (и+1)! 221 ( ) 


Найденная оценка (9.10) называется наилучшей равномер- 
ной оценкой погрешности интерполяции. 


Покажем ее неулучшаемость, т.е. что существуют такие 
функции Х(х), для которых нестрогое неравенство (9.10) реали- 
зуется в виде равенства. С этой целью будем рассматривать ап- 
проксимацию многочленом Лагранжа п-й степени, построенным 
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по чебышевским узлам интерполяции, функции Х(х), представ- 
ляющей собой некоторый, вообще говоря, произвольный много- 
член и + 1-й степени 


Р1(х):= арх"! +ах" +аох" 1 +й +аих+ана1. 


Так как для такой функции ХГ(х) производная и +1-го по- 
рядка есть Г + (х) = РИ (х) = а0(п+1)!, то в неравенстве 
(9.10) можно считать Ми.1 = а0(и+1)!, и сама эта оценка (9.10) 
превращается в оценку 

п-+1 
(Б-а) 


2271 


пах [Ра 2.5 


хЕа,Ь 


Рассматривая же фактическую разность между Р,.1(х) и Г„(х), 
в силу постоянства (и+1)-й производной, т.е. независимости 


РИ (2) от положения точки & на (а, Б), имеем: 


п+1 
РТ) ра)" 


1х 
и баб) 9) 


(см. (8.13) и (9.9); в последнем случае следует принять во внима- 
ние, что П„.1(/)=Т,+1(2) в соответствии со спецификой фикси- 


рования точек /[;). Зная точное значение тах |Т,.1 (, на основе 


1Е[-1, | 
оо" &-а)" 


=а 
2 0 


эй 22п+1 
Как видим, фактическая максимальная разность и ее оценка 
по формуле (9.10) на функции Х(х)=Р,‚.1(х) совпали, значит 
оценка (9.10) достижима, т.е. правая часть ее в общем случае не 
может быть уменьшена. 


(9.11) получаем: 


ая [Ри (х)- (х)]= 


хЕа,Ь 


9.3. О МНОГОЧЛЕНАХ НАИЛУЧШИХ 
РАВНОМЕРНЫХ ПРИБЛИЖЕНИЙ 


Резюмируя исследования предыдущего параграфа, в част- 
ности, анализируя неравенство (9.10), можно хотя бы частично 
ответить на вопрос о сходимости последовательности интерпо- 
ляционных многочленов Лагранжа /„(х) к функции Х(х), для 
которой они построены: 
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если функция Г(х) бесконечно дифференцируема на [а, В] и 
в качестве узлов интерполяции берутся корни многочленов 
Чебышева (приведенные к отрезку [а, Ь]), то 


ших 9-1, -—>0. 


Поскольку пах 1@<)-1,„(х] есть не что иное, как 
хЕа,Ь 


| <) - О „| — Чебышевская норма в пространстве 


С[а, |] непрерывных на [а, 5] функций, можно говорить, что для 
достаточно гладких функций /(х) при специальном расположе- 


нии узлов интерполяции последовательность интерполяционных 
многочленов Лагранжа (Ё„(х)) (построенных по точным значе- 
ниям функции Х(х)) сходится к /(х) по норме Чебышева; дру- 
гими словами, имеет место равномерная сходимость 
последовательности ( [.„(х)) к 1(х). 

Обобщением установленного факта для непрерывных 
(не обязательно дифференцируемых) функций и произвольных 


(не обязательно интерполяционных) многочленов является ши- 
роко известная в математическом анализе теорема. 


Теорема 9.1 (Вейеритрасса) [7, 51, 82, 105, 123, 145, 
173]. Для любой непрерывной на [а, 5] функции Г(х) най- 
дется многочлен О„(х) такой, что 


[7(<)-О,()]<= — \У=>0 Ухе[а, БВ. 


Как следует из теоремы Вейерштрасса, если отказаться от 
того, чтобы аппроксимирующий функцию /(х) многочлен 
О„(х) степени и был интерполяционным, от Х(х) достаточно 
потребовать непрерывность на [а, 6], чтобы за счет повышения 
степени многочлена при надлежащем подборе его коэф- 
фициентов величина чебышевской нормы 9) - „ое, 
могла быть сделанной сколь угодно малой, иначе, чтобы качест- 
во аппроксимации функции Г(х) многочленом О, (х) на отрезке 
[а, В] было сколь угодно хорошим в смысле чебышевской мет- 
рики. 

Если степень и аппроксимирующего Х(х) многочлена 
О„(х) зафиксировать и распоряжаться только его коэффициен- 
тами, то в общем случае величину 9-е, нельзя 
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сделать сколь угодно малой. Однако доказано [45], что для лю- 
бой функции Х(х)е С[ а, Ь] существует единственный мно- 
гочлен О} (х) такой, который из всех многочленов О, (х) степе- 
ни И наилучшим образом аппроксимирует на [а, Б] функцию 
7), минимизируя максимальное расстояние между ХГ(х) и 


О, (х). Этот многочлен, т.е. многочлен [7 (х) такой, что 


[соо ое, = ое 


называется многочленом наилучшего равномерного приблуже- 
ния для Г(х) на [а, Ь] или ее чебышевским приближением ’. 
Для последовательности величин 


Е, (Г)= [76 - ой], ву 


представляющих собой погрешности аппроксимации функции 


Г(х) е С] а, В] посредством многочлена О; (х), в соответствии с 


теоремой Вейерштрасса можно установить монотонную сходи- 
мость к нулю, т. е. что 


Е (Л)<Е„ (У) и Е„(Л) >00. 


Одним из характеристических свойств многочленов наи- 
лучших равномерных приближений является критерий Чебы- 
шева. Его отражает следующая теорема. 


Теорема 9.2 (Чебышева). Многочлен [д (х) является 
многочленом наилучшего равномерного приближения для 
функции Г(х)е С[ а, Ь] тогда и только тогда, когда на 
[а, Ь] существует не менее п +2 точек х; таких, что в них 
поочередно принимаются наибольшие положительные и 
отрицательные отклонения, т.е. поочередно разность 


Л@;)- 07 (х;) равна Е или - Е, где 
Е= |/<)-0/ <] тах |/С9- 0 3] 


С[а,Б] ха, Ь 
Эта теорема (доказательство которой можно найти, напри- 
мер, в [7, 13, 18, 173]) говорит о том, что максимальная ошибка 
аппроксимации функции многочленом наилучшего равно- 
мерного приближения реализуется в числе точек, большем, по 
меньшей мере, на 2, чем степень многочлена, причем знаки 
ошибки чередуются. Точки х;, в которых реализуется макси- 


* 

) Первое доказательство существования многочлена наилучшего 
равномерного приближения для произвольной непрерывной функции дано 
французским математиком Э. Борелем (1871-1956). 
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мальное отклонение многочлена о7 (х) от Г(х) на [а, В], назы- 
ваются точками чебышевского альтернанса. 


К сожалению, неизвестны ни общий вид многочленов наи- 
лучших равномерных приближений, ни способы их построения. 
Имеются лишь некоторые методики построения многочленов, 
близких к наилучшим равномерным (см., например, [18, 63, 134, 
150]), а также способы построения чебышевских приближений 
невысокого порядка для нескольких весьма узких классов функ- 
ций. Последние существенно опираются на приведенную теоре- 
му о чебышевском альтернансе, что демонстрируется в следую- 
щих двух простейших случаях. 


Случай А. Пусть функция /(х) непрерывна на [а, 6], и 
пусть для нее требуется построить многочлен наилучшего рав- 
номерного приближения нулевой степени. Обозначим этот 
приближающий многочлен через фо(х). Он определяется всего 
одним параметром: фо (х) = Ау. Чтобы найти значение этого па- 
раметра для заданной функции /(х), воспользуемся тем свойст- 
вом непрерывной на замкнутом промежутке функции, согласно 
которому на нем всегда найдутся, по крайней мере, две точки, в 
которых она принимает свои наименьшее и наибольшее значе- 
НИЯ. 


Пусть шш Г(х)=т, тах /(х)= М. Тогда совершенно 


хЕ[а,ь] ха, Ь 
т+мМ 
очевидно, что полагая Аб и 1 т.е. подменяя функцию 
+М 
7(>х) функцией Фо ть будем иметь максимальное откло- 
нение 
т+м 
Е - Фо еиьн = пах Ид" М - 
’ ха, 6] 2 
_ т+М_ т-+мМ И М -т 
2 2 ЗВ 


причем точки отрезка [а, Ь], в которых оно реализуется — это 
точки, где принимаются значения т и М. В силу непрерывнос- 
ти /(х), локальные минимумы и максимумы должны чередо- 
ваться; по меньшей мере, два из них определяют точки чебышев- 
ского  альтернанса (с чередованием знаков разностей 


т+м < хе 
р: > Поэтому не существует другой постоянной, ко- 


торая приближала бы Г(х) на [а,Б] лучше, чем постоян- 
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т-+мМ е 
ная в * в смысле чебышевской метрики (на рис. 9.3 в каче- 


стве чебышевского альтернанса могут служить пары точек х1, хо 
или х|, Хз). 


у= М 


[о 


Рис. 9.3. Наилучшее равномерное приближение 
функции Г(х) с помощью постоянной 


Случай Б. Пусть аппроксимируемая функция Х(х) диффе- 
ренцируема и выпукла (в широком смысле) на отрезке [а, 6], а 
аппроксимирующая ее функция ф(х)= Аб + А4х — многочлен 
наилучшего равномерного приближения первой степени. 
Чтобы найти его коэффициенты Ади А|, следует изучить раз- 
ность между Г(х) и ф(х), т. е. функцию и(х):= /(х)- Ау — А1х. 

Так как функция ХГ(х) по предположению выпукла, а сдвиг 
на линейную функцию Ад + Ах не изменяет выпуклости, то и 
функция и(х) выпукла на [а, В]. Если речь идет о выпуклости 
вниз, то, как известно из анализа выпуклых функций, выпук- 
лость и(х) на [а, В] влечет ее унимодальность на этом отрезке, 
т.е. существует единственная точка се[а, Ь], в которой и(х) 
имеет минимум; если и(х) выпукла вверх, то в точке с должен 
быть максимум и(х). В любом случае, точка се [а, Ь] есть точка 
экстремума и(х), и за счет возможности варьирования коэффи- 
циентов функции ф(х) (точнее, коэффициента А|) можно счи- 
тать, что точка с является внутренней точкой отрезка [а, Ь]. 

Потребуем, чтобы точки а, с и ВБ в указанной последова- 
тельности составляли чебышевский альтернанс, т. е. чтобы в них 
последовательно принимались значения Ё, -—Ё, Е или -Е, Е, 
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-Е, где Е =|У<)-Ф@] си, = их 9@©)-Ф@)] — макси- 


мальная погрешность аппроксимации функции Х(х) функцией 
Ф(х). Добавляя к этим требованиям еще необходимое условие 
экстремума дифференцируемой функции и(х) в точке с и воз- 
вращаясь к исходным функциям, приходим к системе четырех 
уравнений относительно четырех неизвестных 40, 41, Е ис (из 


которых, в основном, лишь первые три неизвестные представля- 
ют интерес): 


Г(а)- 5 -Аа=Е, Л(а)- А -Аа=-Е, 
(с) -А-Ас=-Е, Ри (с) -А -Ас=Е, 
ЯБ)--щ-дьеЕ, Две, 
Г(©)-д=0 Л(©)-д =0. 


Получить решение такой системы в общем виде не представля- 
ется возможным, поскольку неизвестная величина с входит в нее 
нелинейным образом (в каждом конкретном случае подобная 
система без проблем решается численно). 

Ключом к геометрической интерпретации случая Б служит 
двоякое выражение коэффициента А; из уравнений системы: из 


первого и третьего уравнений, рассматриваемых совместно, име- 


Ь)- (а 
ем 41 он а из четвертого следует А! = /"(с), что го- 
—а 
ворит о параллельности хорды, стягивающей концы дуги графи- 
ка Г(х) на [а,Ь], касательной, проведенной к Г(х) во 
внутренней точке альтернанса, и аппроксимирующей Х(х) пря- 


мой у= Ад + А]х (рис. 9.4). 


у=/(х) 


а 6 Ь х 


Рис. 9.4. Наилучшая линейная аппроксимация 
дифференцируемой выпуклой функции 
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Пример 9.1. Построим многочлены наилучшего равномерного при- 
ближения нулевой и первой степеней для функции у=зшх на отрез- 


ке о =. 
6 


Сразу заметим, что данная функция всюду дифференцируема 
(а значит, непрерывна) и выпукла вверх на заданном отрезке. При этом 


. . . . в. 1 
т= шш зшх=$т0=0, М= шах зшх=зт-=0.5. 
хе, "1 хе, 7 ы 
’6 ’6 
Следовательно, согласно рассмотренному выше случаю А, найдя 


М+т_0.5+0 и М-т_ 0.5-0 
2 2 2 2 


= 0.25, 


п : > 
при хе, ”. можно считать, что 5шх = 0.25 с предельной погрешнос- 


тью 0.25. 
Далее, в соответствии со случаем Б, продифференцировав данную 
функцию, составляем систему: 


зт0- 4 -4-0=-Е, Аб =Е, 
зшс- Ао — А4с=Ё, зшс- Аи -Ас=Е, 
т. 6; 
Ве, 5-3 а-Д-й = 
6 6 6 
с0$с— А =0, с05с=А1. 


Из нее последовательно находим: 
л 3 
А =0.5:—=— = 0.9549; 
6 л 


ь 
с = агссо$— = 0.3014; 
п 


Ао (= Е) 6 с-А\с) = 0.0045. 


: п 
Таким образом, функцию у=зшх на отрезке 0, а можно подменить 


линейной функцией у= 0.0045 + 0.9549х , и наибольшая ошибка при этом 
не будет превышать величины = 0.0045. 


9.4. ЭКОНОМИЗАЦИЯ СТЕПЕННЫХ РЯДОВ 


Рассмотрим один из простейших способов построения мно- 
гочленов, близких к наилучшим равномерным, о существовании 
которых упоминалось в предыдущем параграфе. 
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В математическом анализе хорошо изучено и широко при- 
меняется разложение функций в степенные ряды, в частности, в 
ряды Тейлора. Частичные суммы таких рядов — многочлены — 
используются в качестве локальных аппроксимаций для ис- 
ходных функций. Степени используемых при этом многочленов 
зависят от требуемой точности аппроксимации, положения точки 
из области сходимости ряда, в окрестности которой производит- 
ся аппроксимация, скорости сходимости ряда. В некоторых слу- 
чаях такой подход мало приемлем из-за медленной сходимости 
рядов и большой неравномерности, т. е. существенной разницы в 
необходимых для заданной точности степенях приближающих 
многочленов при разных значениях аргумента. 

Для улучшения указанных параметров частичных сумм 
степенных рядов можно привлечь многочлены Чебышева. //ро- 
цедура преобразования степенного ряда, представляющего со- 
бой разложение некоторой функции по системе степенных 
функций, в разложение ее по системе многочленов Чебышева на- 
зывается экономизацией степенного ряда [187]. 

Чтобы преобразовать степенной ряд в ряд по системе мно- 
гочленов Чебышева, нужно сначала обратить формулы, по кото- 
рым многочлены Чебышева Т„(х) выражаются через степенные 


функции. А именно, глядя на несколько записанных в $ 9.1 пер- 
вых многочленов Чебышева, можно через них выразить степени 
х последовательно одну за другой: 


1 =10; 
Ра =П; 
1 
х? =— (То +Т>); 
3-й +1); (9.12) 


1 
58 =; +47Т> +Т4); 
г. -с@0й +5 +ТЫ) 


ит. д. (аргументх в этих выражениях для краткости опущен). 
Если некоторая функция у = Х(х) на некотором промежут- 
ке [а, В] < [-1, 1] представлена степенным рядом 


<) =ад +ах+ арх? +й ах +, 


то, подставляя сюда вместо степеней х их выражения (9.12) че- 
рез многочлены Чебышева и приводя подобные члены, можно, в 


принципе, получить разложение Г(х) вида 
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<) =Ь +Ы ТП! +Б>Т> +й +Ь,Т, +й . (9.13) 


Имея в виду рассмотренные в $ 9.1 свойства многочленов 
Чебышева Т,„(х), можно рассчитывать, что многочлены, полу- 


чаемые усечением разложений (9.13), будут близки к многочле- 
нам наилучших равномерных приближений. 


Не пытаясь ответить на все возникающие здесь вопросы как 
теоретического, так и практического характера (некоторые све- 
дения об этом можно найти, например, в [187]), посмотрим на 
примере, какой эффект может дать простейшая процедура эко- 
номизации. 


Пример 9.2. Известно [59], что при хе (-1, || справедливо разло- 
жение 


2 3 4 5 
ПР , (9.14) 
2 3 4 5 


Ограничиваясь первыми пятью членами этого разложения, т. е. мно- 
гочленом пятой степени, перейдем с помощью равенств (9.12) к прибли- 
женному представлению функции [п(1 + х) через многочлены Чебышева: 


1 1 1 
№(1+х)= 7 1 +Г,)+1 СП +18)-3> +4Т> +74) + 


1 1 11 3 Я 1 1 
ЙА В Пить. 
т 1+5173 +715) т 5 ыы 5 


Если здесь оставить всего три первых члена, т.е. представить ш(1+х) 
многочленом второй степени 

|9 |9 3..1. ШВ 

МЕТ НЕ рай, 

32 8 8 32: 3 4 

и сравнить полученное квадратичное приближение функции ш(1+х) с 
х2 

квадратичным же тейлоровским приближением нина непо- 


средственно вытекающим из разложения (9.14), то получим картину, изо- 
браженную на рис. 9.5. 

Она показывает (как это и следовало ожидать), что в середине ин- 
тервала сходимости ряда (9.14) данная функция точнее аппроксимируется 


> х > 
функцией ЕЕ-о-Е В вблизи концов этого интервала — функцией 


1 | 3: © 
Реж Максимальная на (-1, | погрешность в последнем 
случае меньше, но, разумеется, полученная экономизацией квадратичная 
функция не является многочленом наилучшего равномерного приближе- 


ния среди всех многочленов второй степени. 
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у=1/32+(11/8)-х- (3/4)-х? 
у= ш(1+х) 


у=х- 2/2 


Рис. 9.5. Графики функции ш(1+х) и двух ее квадратичных приближений 


Многочлены наилучших равномерных приближений вызы- 
вают болышой теоретический и практический интерес. Напри- 
мер, вычисление значений некоторых основных элементарных 
функций на микрокалькуляторах и компьютерах базируется на 
том, что подсчет значения функции в произвольной точке облас- 
ти определения сводится к вычислению значения на некотором 
стандартном промежутке, на котором данная функция подменя- 
ется многочленом, близким к многочлену наилучшего равномер- 
ного приближения такой степени, при которой гарантируется, 
что максимальная ошибка не будет превосходить заданной фик- 
сированной величины при любом значении аргумента из этого 
промежутка [61, 112]. 
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Кроме процедуры экономизации степенных рядов, для по- 
строения многочленов, близких к многочленам наилучших рав- 
номерных приближений, привлекают и другие приемы, из кото- 
рых наиболее известны алгоритмы Ремеза и Валле-—Пуссена 
[63, 134, 145, 150]. 


Замечание 9.2. Можно встретить и несколько иное трактование по- 
нятия (и процедуры) экономизации степенных разложений. Так, напри- 
мер, в [23] (см. также [44]) этим термином определяется процесс перехода 
от аппроксимации функции /(х) многочленом и-й степени к аппрокси- 
мации многочленом (и-_1)-й степени с сохранением (оценки) точности 
равномерного приближения. В основе такого процесса лежит следующее 
утверждение. 


Теорема 9.3. Пусть Г(х)= 5, (х):= й а х^ ‚ причем 
К=0 
тах |/(х)-5„(х]< д <. 
хЕ[-1, 1] 


ая] и 


Тогда, если выполняется неравенство б ет <=, то многочлен 


Р1(х):=5„—1(х)+ ая [= -- о т 6) аппроксимирует Х(х) на 
отрезке [-1,1| с оценкой Е 
И (х)-Р1(х <=. 
Подробное рассмотрение этого процесса на примерах, дающее пред- 


ставление о его сущности, см. в книге Ланцоша [107], где вместо термина 
экономизация используется термин телескопический сдвиг. 


УПРАЖНЕНИЯ 


9.1. Запишите несколько первых смещенных многочленов Чебышева 
(см. замечание 9.1). Какова формула корней смещенного многочлена 
Чебышева и-й степени? 


9.2. Какая из функций семейства 
Ф(а,Ь, с, х):= ах? + +с 


наиболее близка к функции /(х):= х3 втом смысле, что 
тах /©- ф(а,Б,с,х]=тшт ? 


ХЕ-Ь 
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9.3. Пусть функция /(х) определена и достаточное число раз 
дифференцируема на отрезке [2,4]. В каких точках следует знать 
значения /(х), чтобы  проинтерполировать ее с минимальной 
максимальной погрешностью: 

а) многочленом первой степени? 

6) многочленом второй степени? 


9.4. Найдите неулучшаемую оценку погрешности интерполирования 
функции /(х) = т +х) на отрезке [0,1]: 

а) многочленом первой степени; 

6) многочленом второй степени. 
Постройте эти многочлены. 


9.5. Постройте многочлены наилучшего равномерного приближения 


нулевой и первой степеней и укажите наибольшие величины 
погрешностей аппроксимации для функций: 


а) Г) =Ух при хЕ[0,1; 


6) Г(х)= при хе[1,2]; 


в) /(х)=ш@+х) при хе[0,1]; 


В случае в) сравните чебышевское приближение первой степени с 
результатом линейной интерполяции по чебышевским узлам (см. упр. 9.4). 


я |- 


9.6. Используя разложение функции Х(х)=агсех в ряд Тейлора 
(Маклорена) до пятой степени х, примените процедуру экономизации для 
представления этой функции через многочлены Чебышева первой и 
третьей степеней. Дайте графическое сравнение результатов такой 
экономизации, аналогичное приведенному на рис. 9.5. 
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ГЛАВА 19 | МЕТОД НАИМЕНЬШИХ 
КВАДРАТОВ И НАИЛУЧШИЕ 
СРЕДНЕКВАДРАТИЧЕСКИЕ 
ПРИБЛИЖЕНИЯ 


Рассматриваются две простейшие задачи, приводящие к 
широко известному методу наименьших квадратов: решение пе- 
реопределенных линейных алгебраических систем и подбор па- 
раметров эмпирических зависимостей. Далее ставится более 
общая задача аппроксимации функций обобщенными многочле- 
нами, минимизирующими среднеквадратические отклонения в 
той или иной метрике; показывается, с какими проблемами при 
этом можно столкнуться, если выполнять полиномиальную ап- 
проксимацию на базе обычных степенных функций. Приводятся 
справочные данные о классических ортогональных многочленах, 
изучается простая схема построения системы ортогональных 
многочленов, выписываются конкретные формулы для получения 
с их помощью многочленов Фурье, аппроксимирующих заданные 
функции в интегральном или в точечном смыслах. 


10.1. ПРОСТЕЙШАЯ ОБРАБОТКА ЭМПИРИЧЕСКИХ 
ДАННЫХ МЕТОДОМ НАИМЕНЬШИХ КВАДРАТОВ 


Рассмотрим две задачи, возникающие вне математики при 
изучении каких-либо закономерностей на основе наблюдений 
или экспериментов и приводящие к истокам широко известного 
и весьма популярного метода наименьших квадратов”). Харак- 
терной особенностью таких задач является то обстоятельство, 
что исходный материал для выявления тех или иных закономер- 
ностей — заведомо приближенный, в силу неточности измери- 
тельных приборов, неповторимости условий наблюдений, слу- 
чайных ошибок и пр. Отсюда естественность стремления 
исследователей к накоплению как можно большего количества 
экспериментальных данных с тем, чтобы, усредняя их каким- 
либо образом, получить требуемые значения, как правило, не- 
большого числа параметров изучаемых закономерностей наибо- 
лее точно. 


* 
) Об этом методе и его создателях уже упоминалось вкратце в $ 1.7. 
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Задача А. Предположим, что нужно знать значения т раз- 
личных величин х|, х2,й ‚ хи, которые нельзя измерить непо- 
средственно, но известно, что они находятся в линейной связи, и 
коэффициенты этой связи могут быть приближенно получены в 
результате измерений. Проведя серию из и таких измерений, 
имеем систему линейных алгебраических уравнений (СЛАУ) 


а 1х1 + а12Х2 +Й + арихт =В, 


а21Х1 +а22^2 +й + а2тХт =БЬ, (10.1) 


ах +аи2х2 +й +аитхт =Ви. 


Чтобы эта система могла быть однозначно разрешимой, т.е. 
чтобы можно было найти единственный набор значений пере- 
менных х|, Х2,й ‚ хи, интересующих исследователя, число из- 
мерений и должно быть не меньшим числа неизвестных и, и 
при этом ранг матрицы системы должен в точности совпадать с 
т. В силу того, что все числа ар и Ь; в (10.1) (или часть из них) 
являются экспериментальными данными, получаемое таким пу- 
тем однозначное решение может сильно отличаться от однознач- 
ного же решения, находящегося таким же образом с помощью 
другой серии экспериментов или наблюдений. 

Поэтому число и в системе (10.1) берут заведомо большим, 
чем т, и рассматривают переопределенную, как правило, несо- 
вместную СЛАУ. Поскольку такая система в общем случае не 
имеет решения в привычном понимании, в то время как по смыс- 
лу исходной задачи решение должно существовать, следует ка- 
ким-то образом обобщить понятие решения СЛАУ и получить 
метод его нахождения. 


С этой целью будем искать набор х|, х,й з хт значений 
переменных ху, х›,й , хи не такой, который обращал бы каждое 
из уравнений системы (10.1) в тождество, а при котором была бы 
минимальной сумма квадратов отклонений значений левых час- 
тей уравнений (10.1) от правых (иначе, квадратов невязок). Это 
означает, что вектор х1 } хо; йв хт должен быть решением за- 


дачи минимизации 


и? + +й +82 —> ти, 


где и; = айх! +архо +й +атхи-Ь,. 
Очевидно, минимизируемая функция 
И 
. 2 
Ф@л.х2,й ‚хт)= > (адм +архо +й +атхи-Ь)”, 
1 
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являясь неотрицательной квадратичной, имеет единственную 
* 
точку минимума (х| ; хз; й ; хи ‚ которая может быть найдена из 


необходимых условий гладкого экстремума, т.е. в результате 
приравнивания к нулю частных производных функции 
Ф(х1, х>,й ‚ хи), взятых по каждому из ее аргументов. 


Выполняя дифференцирование, приходим к линейной же 
системе 


И 
2>`(алх + арх +й +атхи - Вай =0, 
1—1 


и 
2У` (ах! + арх +й +атхи - Вар =0, 
1=1 


п 
2>`(апх! + а;2х2 +Й +атхи -— 5; ) ат =0, 
1=1 


которая имеет т уравнений и т неизвестных и которой может 
быть придан стандартный вид СЛАУ: 


п 
| ый [ао +й +[ ата = У Бал , 
1=1 1=1 1=1 
Я. 2 И 
> апар ж+| Хар [хо +й + > атар хт = > Бар, 
ты 1=1 1=1 (10.2) 


1=1 


п и п я 
р 
[али 9 +[ Фаза +й +4 —- > Барт . 
1=1 | 


1=1 


Ее решение — вектор (“; х›;й хи — может быть получено 
каким-либо методом решения однозначно определенных линей- 
ных систем, в частности, учитывающим симметрию СЛАУ (10.2) 
(см., например, [3, 61]). 

Такой способ решения переопределенных систем называет- 
ся методом наименьших квадратов (МНК), а вектор 


* 


3 хо;й з хи по отношению к исходной системе (10.1) называ- 
ется нормальным псевдорешением (более подробно об этом 
обобщении понятия решения можно узнать, знакомясь с теорией 
и методами решения некорректных задач, см. $ 1.7, а также [11, 
28, 33, 34, 41, 93, 128, 148, 175, 194]). 
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Пример 10.1. Пусть определению подлежат две величины х| и хо, 
связь между которыми задается тремя равенствами: 


х+2хо =8.5, 
2х + х2 = 6.7, (10.3) 
ж +3х2 = 1.1, 


и пусть правые части уравнений (10.3) — заведомо приближенные числа. 
Совершенно очевидно, что эта система противоречива, т.е. не имеет ре- 
шения в обычном смысле. Для получения ее нормального псевдорешения, 
т.е. решения в смысле метода наименьших квадратов, составим новую 
систему по типу (10.2) при т=2, п=3: 


6х1 + 7х2 =33, 
71 + 14х› 7 


Решив последнюю, получаем пару Хх =1:8, хо = 3.171, не удовлетво- 
ряющую никакому отдельно взятому уравнению данной системы (10.3) и, 
в то же время, устраивающую систему в целом в оговоренном смысле. 
И рн представление о найденном решении можно получить из 
рис. 10.1. 


2 +х2 =6.7 


х +3лх> =11.1 


Рис. 10.1. Геометрическая интерпретация системы (10.3) 
и ее нормального псевдорешения 


Замечание 10.1. Геометрические образы уравнений системы (10.3) 
не изменяются при умножении левых и правых частей уравнений на оди- 
наковые отличные от нуля числа, т.е. можно считать, что преобразованная 
таким способом система в этом смысле эквивалентна исходной. Однако 
находимые методом наименьших квадратов нормальные псевдорешения 
эквивалентных в указанном смысле систем будут различаться. Например, 
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если второе уравнение системы (10.3) умножить на 100, т.е. заменить 
уравнением 


2001 +100х> = 670, 


а первое и третье оставить неизменными, то система вида (10.2) для такого 
случая есть 


400021 + 20005х. = 134019.6, 
20005х1 + 10013х. = 67050.3. 


Решая ее, получаем псевдорешение х| = 1.756, х> = 3.188, близкое к най- 
денному выше, но все же отличное от него. 

Невязки г; двумерных линейных уравнений можно интерпретиро- 
вать как отклонения точки от прямых в тех случаях, когда их уравнения 
приводятся к нормальному виду. Деля каждое уравнение данной системы 
на квадратный корень из суммы квадратов его коэффициентов, приходим 
сначала к нормализованной системе 


8.5 
— 1 +—=х. =—, 
тии 
и 
ИИС 


1 3 1.1 
—+—х) ==, 
о 0 ^ 0 
из нее, как и выше, получаем однозначно разрешимую систему 


1.1х1 +1.1х7 = 5.49, 
1.1% + 1.9х2 — 8.07, 


решение которой х| = 1.766, х> = 3.225 имеет хорошую геометрическую 
интерпретацию: сумма квадратов расстояний от точки (х|; х>) до всех 
прямых, определяемых уравнениями данной системы (10.3), меньше, чем 
от любой другой точки (х1; хо). 

Ответ на вопрос о том, стоит ли искать такое оптимальное псевдо- 
решение с помощью нормализации уравнений данной системы, или 
составлять систему вида (10.2) непосредственно из данной системы, или 
проводить перед ее составлением некоторое предварительное масштаби- 
рование (усиливающее или уменьшающее роль отдельных связей между 
искомыми величинами), в конкретных случаях зависит от содержательно- 
го смысла коэффициентов и неизвестных СЛАУ (10.1). 


Задача Б. Предположим, что между независимой перемен- 
ной х и зависимой переменной у имеется некая неизвестная 


функциональная связь у = Х(х). Эта связь отображается таблицей 
х хо Хх й р 
У Уо я й Уп 

приближенных значений у; = /(х;), получаемых в ходе наблю- 


дений или экспериментов. Требуется дать приближенное анали- 
тическое описание этой связи, т.е. подобрать функцию ф(х) 
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такую, которая аппроксимировала бы на отрезке [ху,х„| задан- 
ную отдельными приближенными значениями у; функцию /(х). 

Для решения этой задачи заведомо неудачным является ин- 
терполяционный подход хотя бы потому, что функция ф(х) та- 
кая, что ф(х;) = у; при всех {={0,1,й ‚п}, будет мало похожа 
на искомую Г(х), поскольку в ней отразятся все ошибки экспе- 
риментальных данных. Уже это заставляет отказаться от идеи 
интерполяции и находить функцию ф(х) такую, чтобы она хо- 
рошо отражала «в среднем» зависимость между х и у. 

Конкретнее, из каких-либо соображений (аналитических, 
графических или иных) аппроксимирующая /(х) функция ф(х) 
берется из определенного т-параметрического семейства функ- 
ций, и ее параметры подбираются так, чтобы сумма квадратов 
отклонений вычисляемых значений ф(х;) от заданных прибли- 
женных значений у; была минимальной. Такая функция (т.е. при 
таком оптимальном наборе параметров) будет наилучшей ап- 
проксимацией Х(х) среди функций выбранного семейства в 
смысле метода наименьших квадратов. Ясно, что число данных 
приближенных значений у; в таблице должно быть не меньшим, 
чем число параметров в подбираемой зависимости ф(х); как 
правило, считается, что и >> т. 

Итак, согласно МНК, задаем семейство 


У=Ф(х, а, а2,й ‚ ма) 


и ищем значения параметров а1, а2,й ‚ а» (где т<п-1), решая 
экстремальную задачу 


п 
: 2 : 
Ф(а, а2, й , ат ):= У (Ф(хьа, а>,й , ав)—у;) ти. 
1=0 
5 * * * 
Как и в задаче А, оптимальный набор параметров а1, а2,й ‚ а» 
может быть найден из системы 


11 дФ 
У (Ф(хрьаь а2,й ат )-у,) = =0, 


1=0 да ве 

п дФ 

> (Ф(хьаь ай ‚ат)-у—= =0, 

ей да? р (10.4) 


И дФ 
> (@Ф(хь ара» й ‚аи )-У)— =0, 


1=0 Он 


409 


представляющей необходимые условия экстремума функции 
Ф(ат, а2,й ‚ ат), в силу ее специфики, являющиеся и достаточ- 
ными условиями ее минимума. 

Если функция ф(х, а1, а2,й ‚а„) есть линейная функция 
относительно своих параметров а1, а2,й ‚ аш, то система (10.4) 
тоже будет линейной; в общем случае (10.4) — нелинейная сис- 
тема, что влечет за собой определенные трудности при ее реше- 
нии. Спасительным в последней ситуации является тот факт, что 
обычно при задании семейств функций, аппроксимирующих 
реальные зависимости, число параметров берется небольшим 
(2 — 3), причем какие-то из этих параметров могут входить ли- 
нейным образом. 

В зависимости от характера табличных данных, изучаемого 
с помощью их изображения в соответствующей системе коорди- 
нат или с помощью некоторых прикидочных расчетов (см., на- 
пример, [58, 62]), при обработке результатов экспериментов час- 
то используют те или иные из следующих двухпараметрических 
семейств функций: 


у=ах+Ь, у=а+ЬШх (у=а+Ьх), 


у=ах?, у=ае® (у=а:102), 
ВИ. 4 В. 
ы х’ ы ах+Ь’ ах+Ь’ 


реже применяются трехпараметрические семейства 


у=ах? +Вх+с, у=ах? +с, 


рх 


у=ае” +с (у=а-10 


+с); 


при изучении периодических явлений применяют тригонометри- 
ческие функции. 

В качестве примера рассмотрим ситуацию, когда есть осно- 
вания считать, что значения х; и соответствующие им прибли- 
женные значения у; отражают некую линейную зависимость. 
Тогда, полагая 

фФ(х, а, Б) = ах+Ь, 


находим а =. ОИ а 
ОБ 


да 
функции ф составляем систему типа (10.4): 


‚ И для вычисления параметров этой 


И 
У (ах +Ь-у,).х; =0, 
2—0 
и 


У (ах, +Ь-у,).1=0. 
50 
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Упрощая ее, приходим к стандартной СЛАУ 


и 2 И И 
>. а+ >, Б= >. х:У,, 
1=0 1=0 1=0 (10.5) 


И и 
Ух; а+(п+ПЬ=Уу,; 
0 1=0 


с симметричной квадратной матрицей коэффициентов и заведо- 
* * 


мо однозначным решением (а; Ь 

Заметим, что вместо того, чтобы решать нелинейные сис- 
темы, получающиеся из (10.4) при поиске параметров конкрет- 
ных семейств функций, когда эти параметры входят туда нели- 
нейным образом, можно попытаться сначала линеаризовать 
подбираемую зависимость. 


Пусть, например, в качестве аппроксимирующей /(х) функции бе- 
рется экспоненциальная функция 


Ф(х, а, В) = ей. (10.6) 
Найдя ее частные производные 
д д 

Ре, Р — абейх, 
да 0Ь 
видим, что подстановка этой функции и ее производных по параметрам в 
(10.4) приведет к нелинейной относительно параметра В системе. Чтобы 
не решать нелинейных уравнений, поступим так. 

Прологарифмируем равенство 


аейХ У 


получив при этом 
ша+вх=Шу, 

введем новый параметр А:= ша и пересчитаем данную таблицу, переведя 
значения у; в У; = шу;. По таблице 

Хх хо Х1 й Хи 

у 7 Я й 7, 

* 
методом наименьших квадратов находим оптимальные параметры А и 
* > < 
Ь линейной функции У = А+фх (полагая ф\(х, А, 5) = А+ 5х, пользуемся 
системой (10.5), считая там а=р, ар=А). После этого вычисляем опти- 
* 


* 
мальное значение а’ =е“ параметра а исходной зависимости (10.6) и 
записываем итоговый результат 


* * 
1()=а’е?*. 
Замечание 10.2. К методу наименьших квадратов могут привести и 
иные соображения. Например, в курсах математической статистики к нему 


приходят, изучая корреляционные и функциональные зависимости при 
наличии случайных ошибок [30, 83, 121 и др.]. 
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10.2. ОБОБЩЕННЫЕ МНОГОЧЛЕНЫ НАИЛУЧШИХ 
СРЕДНЕКВАДРАТИЧЕСКИХ ПРИБЛИЖЕНИЙ 


Вернемся к общей постановке задачи аппроксимации функций. 

Пусть аппроксимируемая функция /(х) и аппроксими- 
рующая функция ф(х) непрерывны на отрезке [а,Б] и аппрок- 
симация должна производиться так, чтобы функция ф(х) «в 
среднем хорошо описывала» поведение функции Х(х) при 
хЕ[а, 6]. Будем здесь постоянно иметь в виду две аппроксима- 
ционные ситуации: первая, это когда функция /(х) считается 
(по крайней мере, теоретически) известной в любой точке х от- 
резка [а,Б], и близость между Г(х) и Ф(х) понимается в инте- 
гральном смысле, и вторая, когда /(х) известна (причем при- 
ближенно) только в и+1 точках хо, х1,й ‚х„ отрезка [а,6], в 
которых и производится согласование /(х) с ф(х) подобно то- 
му, как это делалось при рассмотрении задачи Б в предыдущем 
параграфе. В связи с этим, будем параллельно рассматривать: 

а) пространство С’, [а, Ь] непрерывных на [а, 6] функций со 
скалярным произведением 


1 Ь 
(1, Ф) са, 5] =, (10.7) 
метрикой (расстоянием) ы 


Ь 
Ри = у о) -о (10.8) 


и нормой 


| 12 
МС а] = (у, Са, 5] —- УС, Л) са, в] = >И); 


6) пространство В„.1[а, Ь] сеточных функций, определен- 
ных в точках х; в [а, 6] (1=0,1,й ‚п), со скалярным произведе- 
нием 


1 Ш 
ыы т), (10.9) 


метрикой 


(1(х)-9(х)} 040) 


1 И 
п+1 = 
1= 


Ю(Х, Ф)в [. = 
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и нормой 


МТ, [= РС ам =). Я 


Введенные указанным способом метрики (10.8) и (10.10) 
характеризуют близость функций Г(х) и Ф(х) в пространствах 


Са, В] и В. [а, В] соответственно; по отношению к прибли- 


женному равенству /(х)= ф(х) при хе [а, Б] они представляют 


собой интегральную и точечную (дискретную) среднеквадра- 
тические ошибки. 


В силу того, что 


Хост < (9) Дьнт тв 


Ь 
[О-о =тт > р Фсиы=т, 


можно сказать, что применение метода наименьших квадратов к 
аппроксимации функции /(х) функцией ф(х) заданного семей- 
ства означает подбор такой функции ф(х), которая минимизиру- 
ет среднеквадратическую погрешность приближенного равенства 
РЕ в интегральном или в точечном смысле; в связи с 
этим, она называется наилучшим среднеквадратическим при- 
ближением Г(х) на заданном семействе функций. 

Рассмотрим, к чему сводится процесс построения наилуч- 
ших среднеквадратических приближений в одном конкретном, 
но достаточно общем случае, когда аппроксимирующая Х(х) 
функция ф(х) представляет собой линейную комбинацию не- 
а других, вообще говоря, более простых (базисных) 

ункций. 


Пусть {Ф) (х) РИ — некоторая заданная на [а, В] система 


линейно независимых функций. Обобщенным многочленом бу- 
дем называть функцию 


Оп (х) = соо (х) + фи (х)+й +ст@т(х), (10.11) 
где со, с1,й ‚ст — произвольные вещественные числа (коэффи- 
циенты обобщенного многочлена). Поскольку функции ф; (х) 


считаются заданными, построение обобщенного многочлена 
наилучшего среднеквадратического приближения для данной 


функции Х(х) сводится к нахождению оптимального набора 
* * * 
со, с1,й ‚ст коэффициентов О» (х) в (10.11) на основе метода 


наименьших квадратов, т.е. к решению задач минимизации: 
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И 
2 ь 
(соо) ++ +ст@т(х,)- Л(х;)) > пт (10.12) 
1=0 
— в дискретном случае; 


[Кеофо(х)+ сц) +й +сифи(х)- 10) 4 — тт (10.13) 


а 
— в непрерывном случае. 


Для первой из этих задач, т.е. для (10.12), необходимые (и 
достаточные) условия выражаются системой 


Ху ) (софо (х ча (х) + 1Стт (х;)-7(х:))=0, 


р х) (сов (х,) + с! (сх) +й +стфи (х:)- 1 (х))=0, (10.14) 


У‘ (х 2) (со (х р) +ав(х р + +стфи (х;)— Г(х,)) =0. 


После элементарных преобразований она может быть переписана 
в терминах скалярных произведений (см. (10.10)): 


(Ф0,Фо со + (Фо) +й + (Ф0,Фи ст = (Фо,), 
(21,0 )с0 + (21,9 1 +й + (21,Фт №2 — (21, Г), 


(2т›Фо 0 + (Фи, с +й + (Фт,Фт Юя = (ФГ). 
Если сеточные функции ф,(х;) образуют систему линейно 
независимых элементов пространства Ви [а, Ь], то полученная 


симметричная линейная алгебраическая система (10.15), назы- 
ваемая нормальной системой МНК, имеет заведомо отличный 
от нуля определитель (это известный определитель Грама [3, 13, 
57]), и значит, однозначно разрешима. Следовательно, при за- 
данном базисе 2 путем решения системы (10.15) можно най- 


ти единственный обобщенный многочлен 


* * * * 
Оп (х) = софо(х) + с1Ф1(х)+й +стфы(х) 
* 
такой, что /(х)= О» (х) при хе [а, Ь] с наименьшей среднеквад- 
ратической ошибкой 


(Г, 0) = 


(10.15) 


50-0). = 9046 
+10 
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Вернемся вновь на начальный этап построения обобщенно- 
го многочлена наилучшего среднеквадратического приближения, 
но теперь уже в интегральном смысле. Легко убедиться, что за- 
писав для задачи (10.13) необходимые условия, т.е. получив ин- 
тегральный аналог системы (10.14), от нее приходим к той же 
самой нормальной системе МНК (10.15) ‚ только скалярные про- 
изведения здесь расшифровываются с помощью формулы (10.7). 
Для той же /(х) и при том же базисе (9; ‚ ввиду различий в 


скалярных произведениях (10.7) и (10.9), решение системы 
(10.15) в этом случае дает, вообще говоря, уже другой (возмож- 


* 
но, «близкий» к со, с! ‚Й ‚ ст) оптимальный набор со, с1,й ‚Ст 
коэффициентов (10.11) и приводит к представлению 


(>) = От (х) = 6090 (х) + 411 (х) +Й +Стт (х) 
с наименьшим среднеквадратическим отклонением 


р(г, О, (х))= (10.17) 


= |) 0,5) 


ве прива чо ры ОАО 
где О„(х) — произвольная функция вида (10.11)). 


Замечание 10.3. Множители 


в скалярном произведении (10.7) 
—а 


И 


в (10.9) введены только ради удобства трактовки величин р(Х, Ф) 
п+ 
в (10.8) ив (10.10) как среднеквадратических ошибок приближенного ра- 


венства /(х)= ф(х). Пользуясь более привычными формулами скалярных 


произведений (без этих множителей), в итоге все равно пришли бы к той 
же системе (10.15) (проверьте!). Так что в дальнейшем под скалярными 
произведениями в нормальных системах МНК могут пониматься обычные 
интегральные и точечные (евклидовы) скалярные произведения, в то вре- 
мя как при подсчете среднеквадратических погрешностей (т.е. в формулах 
(10.16), (10.17)) эти множители обязаны присутствовать. 


Анализируя СЛАУ (10.15), приходим к выводу, что она 
чрезвычайно упрощается в случае, когда базисные функции 
ф;(х) образуют на [а, 5] ортогональную систему. 

Как известно, взаимная ортогональность функций из мно- 
жества {Ф, ©}. означает, что (=, Ф‚)=0 при любых А+ /. 


Следовательно, биреноы со, сьй ‚ст обобщенного мно- 


гочлена наилучшего среднеквадратического приближения (10.11) 
могут быть сразу выписаны из превратившейся в диагональную 


системы (10.15), а именно: 


415 


(90.0) р 
= (Ф./) _ Ф. ) 
(гы) | Е: 


_ (и) _ (@т-/) 


"о (2„.@т) [= | 


В таком случае эти оптимальные коэффициенты называются 
коэффициентами Фурье, а обобщенный многочлен (10.11) с 
этим набором коэффициентов (т.е. обобщенный многочлен наи- 
лучшего среднеквадратического приближения для /(х)) называ- 
ется обобщенным многочленом Фурье. 

Еще проще построение таких многочленов, когда система 
{Ф) (х) НР — ортонормированная. Тогда [2 =1, и из (10.18) 
следует, что с; = (‚,/) при любом /Е{0,1,й ‚ т}, т.е. аппрок- 
симация функции /(х) обобщенным многочленом Фурье имеет 
вид 


ЛС) = (Фо, Г) + (ФГ) (+ й + (ФГ) (х). (0.19) 


В частности, в математическом анализе достаточно подроб- 
но изучаются представления функций (не обязательно непрерыв- 
ных) выражениями типа (10.19), в которых в качестве базисных 
функций используются функции ортогональной на [-л,л] сис- 


темы {т Ах, созАх | КЕ №}. Такие представления в этом случае 
называются отрезками тригонометрических рядов Фурье. 


10.3. О НОРМАЛЬНОЙ СИСТЕМЕ МНК ПРИ 
ПОЛИНОМИАЛЬНОЙ АППРОКСИМАЦИИ 


Возьмем в качестве базисных функций для обобщенного 
многочлена (10.11) степенные функции 


2 т 
Фо =Т, Ф=х, $2=х, йЙ [ ‚, Фи=х. 
В таком случае ОН превращается В обычный многочлен степени 
т канонического вида: 


О") =Р,(х) =со+сх+сох? +й +сих". (10.20) 
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Посмотрим, что представляет собой система (10.15) для вычис- 
ления коэффициентов многочлена Р„(х), если ставится задача 
аппроксимировать с его помощью некоторую функцию /(х) по 
метрике пространства Су [0, \|, т.е. для нахождения такого набо- 
ра коэффициентов со, с1,й ‚сти в (10.20), при котором обеспечи- 
вается минимум величины 


1 
(<) - гоу ак. 
0 


Подсчитав скалярное произведение вида (10.7) 
1 1 
т ВОО | 
(=, ф;)= [хх = риа =—_, 
0 0 +] +1 


из (10.15), варьируя Ги / от 0 до т, получаем систему 


Ст к 
ы 0 


1 
60+—2&-й + 
От. 


1 
"я ЛЕМ (10.21) 


Эта нормальная система МНК для построения многочлена 
т-й степени наилучшего среднеквадратического приближения 
функции Х(х) на отрезке [0, 1] в векторно-матричных обозначе- 
ниях имеет вид 


Нин е=г, 


где = (с: с0й ен) — вектор неизвестных (коэффициентов 
многочлена Р, (х) в (10.20)), 


од 
1 т-+1 
Ь х/(х)ах и зы 1 


ВЕ 7-1 


ь]= 


| х" Г(х)ах 


— вектор свободных членов и матрица коэффициентов 
СЛАУ (10.21) соответственно. 
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Матрица Н „„.1 носит название матрицы Гильберта и ши- 


роко известна в математике как классический пример плохообу- 
словленной матрицы. Элементы этой матрицы являются просты- 
ми функциями индексов, она заведомо не вырождена и, в то же 
время, ее мера обусловленности сопаН „.| с увеличением т 


растет чрезвычайно быстро [3, 183 и др.]. Так, если при т=1 
можно считать сопП@Н> =|Н.|. но |=20, то уже при т=5 


имеем сопа Нк = 107, апри т=9 сопа Н1о =1013. 

Зная, что число обусловленности характеризует чувстви- 
тельность СЛАУ к ошибкам в исходных данных, т.е. фактически 
служит коэффициентом увеличения относительных погрешно- 
стей, которые неизбежны при переводе обыкновенных дробей в 
десятичные и при вычислении интегралов в правой части систе- 
мы (10.21) в процессе ее решения, можно сделать вывод о не- 
пригодности использования базиса из степенных функций для 
построения многочленов наилучших среднеквадратических при- 
ближений сколько-нибудь высоких степеней. 

Если рассматривать дискретный случай, т.е. строить с по- 
мощью МНК аппроксимирующий Х(х) при хЕ [0, || многочлен 
Р„(х) (10.20), исходя из знания и+1 значений Г(х;) в точках 
хо, х,й ‚ х„ отрезка [0, 1], то подстановка в систему (10.15) по- 


лученных на основе определения скалярного произведения (10.9) 
выражений 


1 2 1х 
(Ф)=— Ух, (Фи, Л)=— Ум) 
п+1 0 п+1 0 
приводит к нормальной системе МНК вида 


1 и 1 м т 1 у 
во +| — Ух; ай + — Ух и=— У Г(х,), 
п+1,— п+1;-0 п+1;-0 
ы м ь п Я 
х НИЕ ИВ хай +| — =” бт = 
пати 0 +12. 1 я 2. м т 
ги 
=—— х; х;}, 
+12 «7 (х,) (10.22) 
1 > я 1 у т-+1 У. 2т 
7 7 
х |0 + жай + —орох |бт= 
п+1,9 1+1; 10 
1 
т 
= Л (х,) 
1=0 
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Разумеется, множитель в каждом уравнении можно опус- 


п+| 
тить, однако с ним легче увидеть, что, например, в случае рав- 


номерного распределения узлов х; на отрезке [0, ||, т.е. при 


7 
х; =—, матрица коэффициентов полученной системы (10.22) бу- 
п 


дет асимптотически приближаться с ростом и к матрице систе- 
мы (10.21) (т.е. к матрице Гильберта Н „.1), что порождает опи- 


санные выше проблемы при решении системы, связанные с 
численной неустойчивостью. 


Заметим, что если линейная независимость системы сте- 


пенных функций 1, х,й ‚х” как элементов пространства С. [0, 1] 
хорошо известна и фактически видна из невырожденности мат- 
рицы Гильберта системы (10.21), то с линейной независимостью 
системы их сеточных аналогов стоит разобраться. 

На сетке несовпадающих узлов х; Е [0,1] при #=0,,й ‚п 


из непрерывных степенных функций 1, х,й ‚ х” получаем систе- 
му из т +1 векторов размерности и + 1 — элементов пространст- 
ва В,.1[0, 1] сеточных функций: 


2 т 

1 хо хо хо 

1 Хх х? хм 

Фо = т} фт = в | Фф> = - ‚й. Фт = т 
оо ы 


Эти элементы образуют линейно независимую систему тогда и 
только тогда, когда равенство нулю их линейной комбинации 
“0Фо +04 Ф1 + @2Ф2 +Й +аифи возможно только при нулевых 


значениях коэффициентов 40, @1,й ‚@т, т.е. если однородная 
линейная относительно 0, 01,й ‚аи СЛАУ 


а + хо@1 + хбр +й +хТаи =0, 
0, 


0 + мб +2) +й +х’ат 


ад + хе + Хар +й +хТа =0 


имеет только тривиальное решение. Последнее возможно только 
при условии, что ранг матрицы системы равен т +1, но для это- 
го нужно, чтобы число уравнений было не меньше, чем т-+1. 
Отсюда приходим к необходимости требования, чтобы число 
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точек согласования (п+1) было не меньшим числа отыскивае- 
мых параметров (т +1). При этом очевидно, что случай т=и 
замыкает теорию полиномиальной аппроксимации по методу 
наименьших квадратов на теорию лагранжевой интерполяции. 


10.4. СИСТЕМЫ ОРТОГОНАЛЬНЫХ МНОГОЧЛЕНОВ 


Имея в виду, что нас интересует, в первую очередь, 
полиномиальная аппроксимация функций, и при этом 
показаны недостатки степенных функций для их использования в 
качестве базисных при построении многочленов наилучших 
среднеквадратических приближений ($ 10.3) и отмечены досто- 
инства ортогональных многочленов в этой роли ($ 10.2), приве- 
дем некоторые сведения справочного характера о последних. 


Многочлены Лежандра 7„(х) — наиболее употребитель- 
ные из классических ортогональных многочленов и единствен- 
ные, для которых условие их ортогональности на отрезке [-1, 1] 
выполняется «в чистом виде», т.е. через равенство нулю скаляр- 
ного произведения вида 


| 
(1, в) = |7<ебдах, (10.23) 
— 
а именно: 
1 0, если К =], 
Года =1 2 , (10.24) 
= ——_, если =). 
2+1 


Для многочленов Лежандра известна явная, порождающая 
их, формула Родрига*) 


п 
4 2—1}. (10.25) 
т2" 
Положив 1 =1| и найдя по формуле (10.25) 7; =Х, все после- 


дующие многочлены Лежандра можно получать один за другим с 
помощью рекуррентной формулы 


(п ы О и+1(х) — (2п+ х д„(х) + пд „-1(х) =0. (10.26) 


Яи(х) = 


*) Родриг (Родригес) Бенжамен Оленд (1794—1851) — французский 
математик. Появление формулы Родрига (10.25) датируется 1814 годом. 
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При и=1, 2,3, Йй из нее имеем соответственно: 
19 
#2 => 6х 5 


Дз = 56 -3х), 


4 = 65» —30х2 +3), 


Ж5 = 63° — 70х3 +15х) ит.д. 


Сравнивая многочлены Лежандра с рассмотренными в гл. 9 
многочленами Чебышева, можно обнаружить, что их сходство — 
не только внешнее. Эти многочлены характеризует ряд одинако- 
вых свойств. Например, как и многочлены Чебышева, многочле- 
ны Лежандра и-й степени имеют на отрезке [-1, |] ровно и раз- 
личных действительных корней (см. свойство 9.1). В то же 
время, как и многочлены Лежандра, многочлены Чебышева 
Т,(х) относятся к числу классических ортогональных многочле- 
нов, но ортогональность здесь понимается в более широком 
смысле — это ортогональность с весом. А именно, условие ор- 
тогональности многочленов Чебышева 7Т„(х) на отрезке |[-1, 1] 
имеет вид 


0, если К=*ру, 


1 
о-то-ее => если к =/=0, 
и 


М-? 


д, если К =/=0. 


Наряду с многочленами Т,(х), называемыми также много- 
членами Чебышева первого рода, ортогональными на (-1, 1) 
являются и многочлены Чебышева второго рода И „(х), опреде- 
ляемые через 7, (х), а именно: 


т уш[(и + Г]агссозх 
О, (х) = в) == | . ] . 
п+| уш агссозх 


Многочлены Лежандра и многочлены Чебышева первого и 
второго рода принадлежат одному семейству многочленов Яко- 
би, ортогональных на конечном промежутке (а, Ь) с некоторой 
весовой функцией р(х)>0 определенного вида (для многочле- 
нов Лежандра р(х)=1) и задаваемых формулой, обобщающей 
формулу Родрига (10.25) [132 и др.]. 
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Многочлены Лагерра*) /„(х) определим требованием их 
ортогональности на промежутке [0, +0) с весовой функци- 


ейе *, а именно, условием 
_ р-р 0 ‚еслиК=У, 
е щих). 6; (х)ах = 
0 " (К)? ‚если =). 


Как и предыдущие ортогональные многочлены, многочлены Ла- 
герра удовлетворяют рекуррентному соотношению типа (10.26) 


Г1(х)-(@п+1-х)1.(х)+п2 11 (х) =0, (10.27) 
где иеМ№, 4 :=1, Д :=-х+1. Отсюда легко получить несколько 
первых многочленов Лагерра: 

0 =х? —4х+2, 

[3 =-х3 +9х? —18х+6, 

[4=х* —16х3 +72х? —96х+24, 

15 == +254 —200х° +600х? —600х+120 ит.д. 


Заметим, что под тем же обозначением /„(х) в литературе 


1 
может встретиться многочлен — т (х). Кроме того, следует упо- 
п 


мянуть, что существуют ортогональные многочлены Лагерра не- 
сколько более общего вида; в частности, ортогональность может 


пониматься с весовой функцией р(х)=х“е *, где а > -1 (в рас- 


смотренном случае @ =0). 
Многочлены Эрмита**) Н„(х) ортогональны на всей чи- 
2 


словой оси с весом р(х)=е ^ . Они удовлетворяют интеграль- 
ному условию ортогональности 


"т РН ©-н. см 0, если К = /, 
е ` Ну(х)-Н ‚(хх =, 

ь- А 2 МУл, если К =}, 
и рекуррентному соотношению 


Ни (х)-2хН„(х)+2пН„—1(х)=0, (10.28) 


ы. Лагёрр Эдмон Никола (1834—1886) — французский математик. 


** 
) Не надо путать определяемые здесь ортогональные много- 
члены Эрмита с рассмотренными ранее интерполяционными много- 


членами Эрмита (см. $ 8.8). Обозначение Н,„(х) (каки Г„(х)) несет в этой 
книге двойную нагрузку. 
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где ие М, Но:=1, Ну := 2х. Подставляя в (10.28) последователь- 
но и=1, 2,й , находим первые многочлены Эрмита: 

Н)=4х? -2, 

Нз = 8х3 —12х, 

Нд =16х“ —48х? +12, 

Ну =32х° —160х3 +120х итд. 
Как видим, они имеют такую же структуру, как и многочлены 
Чебышева. 


Ортогональные многочлены Якоби, Лагерра и Эрмита об- 
ладают рядом общих свойств. Все они являются решениями од- 
ного семейства обыкновенных дифференциальных уравнений 
второго порядка. Все ортогональные многочлены Р,(х) одной и 
той же системы линейно независимы и удовлетворяют трехчлен- 
ному рекуррентному соотношению вида 


„Ри +1(х)+(В„ —х)Р,(х)+7„Р,1(х)=0, (10.29) 


содержащему в себе, как легко убедиться, соотношения (10.26), 
(10.27), (10.28), а также (9.2), для конкретных многочленов Ле- 
жандра, Лагерра, Эрмита и Чебышева соответственно. Все и 
корней ортогональных многочленов Р,(х) — простые и находят- 
ся на промежутке ортогональности; при этом корни многочлена 
Р,(х) разделяются корнями многочлена Р„_1(х) [187]. 


Более подробные сведения об ортогональных многочленах 
и их свойствах можно найти в специальной, справочной, учебной 
и даже научно-популярной литературе [19, 90, 109, 132, 169, 187]. 


10.5. ПРОСТАЯ ПРОЦЕДУРА ПОСТРОЕНИЯ 
СИСТЕМЫ ОРТОГОНАЛЬНЫХ МНОГОЧЛЕНОВ 


В целях полиномиальной аппроксимации функций может 
оказаться более удобным использование не конкретных класси- 
ческих ортогональных многочленов, введенных в предыдущем 
параграфе и жестко привязанных к конкретному скалярному про- 
изведению (они еще потребуются в дальнейшем, см. гл. 12), а 
последовательное построение системы многочленов, взаимно ор- 
тогональных в смысле того или иного скалярного произведе- 
ния (.,.), фиксируемого в конкретных ситуациях. 


Итак, будем строить такую систему многочленов {4х}, 
что: 
Й 40% =1; 
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2) ак =ак(х) — многочлен степени А с коэффициентом | 
при старшей степени х; 


3) (к, а;)=0 при любых /=А (при этом заведомо 


2 

(ак ак) = [ак |” #0). 

Эта система будет получаться последовательным подсоеди- 
нением к заданному ее элементу 40 :=1 многочленов повышаю- 
щихся на единицу степеней, ортогональных всем предыдущим. 

Полагая 41 = х- а, из условия 41 1 90, т.е. из (41, 40) =0, 
по свойствам скалярного произведения имеем 

(х, 90) 04 (40, 490) =0, 
откуда получаем выражение коэффициента с: 


(а 
- 4. (10.30) 
(40, 40) 

Далее воспользуемся тем фактом, что рассмотренные выше 
классические ортогональные многочлены удовлетворяют трех- 
членному рекуррентному соотношению (10.29) с некоторыми 
наборами параметров @„, В», Уп. В силу договоренности о том, 
что здесь будут строиться ортогональные многочлены ах (х) со 


1 


старшим членом х“, можно ограничиться меньшим числом па- 
раметров и попытаться находить (к +1)-й многочлен а/-1(х) по 
уже известным многочленам а/_1(х) и ах (х) по формуле 


Чк+1 = Хх — бу -1Чк — ВкЧк-1ь (10.31) 
которая будет полностью определять дальнейший процесс по- 
строения 42, 43, 44,й ‚ если будут известны законы вычисле- 
ния коэффициентов аут и Ву при К =1, 2, 3,й 

Сначала убедимся, что формула (10.31) «работает» при 
К=|1. Для этого нужно показать, что в равенстве 
42 = х41 - 4241 - 9190 можно однозначно найти коэффициенты 
а) и В\ так, чтобы многочлен 4› был ортогонален одновремен- 
но многочленам 40 и 41. Имеем: 


а 90) =0, С ты 90) @2 (41, 40)- В1(40, 40) =0, 
(42, 4) =0 (хат, 41) @2(а1, 41)- Ви (40, 41) =0. 


Но многочлен а1, благодаря (10.30), таков, что (41, 40) = 0; по- 
этому из последней системы сразу получаем 


_ @аьь 40) _ @аь 4) 
7 И 
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Предположим, что уже построены многочлены 40, 41,й ‚4х 

такие, что имеет место их попарная ортогональность: 
4-14; УБ/Е{О, В , К}: 1). (10.32) 

Беря многочлен 4.1 в форме (10.31), покажем, что он за- 
ведомо ортогонален каждому из многочленов от 40 ДО ах_о не- 
зависимо от значений коэффициентов арт и рук, и найдем эти 
значения из требования ортогональности многочлена 4+1 мно- 
гочленам ати ах. 

Для этого сначала рассматриваем скалярные произведения 
(кт, 4;) при 1=0,1й ,Е-2: 


(авы, а;)= @аь, а;)- мак» а;}- Векь Чу). 


В этом равенстве имеем (ак, а;)= Ои (Чт, а;)= 0, в силу до- 
говоренности (10.32), а равенство нулю скалярного произведения 
хак, Ч} можно установить на основе — равенства 


хак, а;)= (@ь, ха), очевидного, по крайней мере, для исполь- 


зуемых здесь скалярных произведений вида (10.7), (10.9) (для ко- 
торых в выражении скалярного произведения степенных функ- 


ций И, х/ применимо их свойство хи. х/ =х*Л. 
Действительно, так как при /<К-2 степень многочлена ха; не 
превосходит А -1 и так как ортогональные многочлены 4; ли- 
нейно независимы, то многочлен ха; может быть представлен в 
виде линейной комбинации многочленов 40, 41,й ‚Ч у+1 © неко- 
торыми коэффициентами 70, 71,й , У,;+1, и значит, 


(дк, ха; ) = Хо(Чк» 4о)+ 7 (ак» а) +й +71» ан) =0, 


поскольку /+1<А-1 и выполняется условие (10.32). 
Далее, из требования (9+1, Чх1) = 0, т.е. из 


(Ч, ак) — Яр (Ч к, ак) Ва (Чк-ь Ч) =0, 
учитывая, что (4%, Чк1) = 0, находим 
_ Оч ака) 
| иииищикт. 
(Чр-т Чк-1) 


и из требования (44.1, Ч ) = 0, т.е. из 


(10.33) 


(хак, ак) - ак (ак, ак)- Вк(акль Чк)=0, 
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аналогично получаем 
= (хак , к) 


; 10.34 
(Ч, ак) 


+1 


Таким образом, завязывая воедино выведенные для выра- 
жения (10.31) формулы коэффициентов (10.30), (10.33) и (10.34), 
приходим к следующей итерационной процедуре получения ор- 
тогональных многочленов все повышающихся степеней: 
ба), 9% 69) ()_ @Чк Со, Ч 69) 
(ак (х), ак (х)) (ак-и(х), ак) 


(х, 40(х)) 
(ао(х), 40(х))` 


ки (х) = ха (х)- Чк—1(х), 


(10.35) 
где к=12,й; 90(х)=1, а(х)=х- 


10.6. АППРОКСИМАЦИЯ ФУНКЦИЙ 
МНОГОЧЛЕНАМИ ФУРЬЕ 


Резюмируя результаты $$ 10.2 и 10.5, приходим к выводу, 
что построение многочлена т-й степени О„(х), осуществляю- 
щего наилучшее среднеквадратическое приближение для за- 
данной функции /(х), можно выполнить достаточно просто и 
численно устойчиво, представляя ее отрезком ряда Фурье: 


= 69= Хера69, (10.36) 
= 


где попарно ортогональные многочлены а;(х) можно получать 
итерационным процессом (10.35), а коэффициенты Фурье суть 


(см.(10.18)) 
_ 69. 76) 
769,416) вы 


Те или иные конкретные аппроксимации Х(х) типа (10.36) 
получаются фиксированием тех или иных конкретных скалярных 
произведений. 


Например, аппроксимируя функцию Х(х) на отрезке [а, Ь] 
многочленом О„(х) (10.36) таким образом, чтобы минимизиро- 
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валось определенное равенством (10.8) среднеквадратическое 
отклонение многочлена О„(х) от данной функции /(х), в форму- 
лах (10.35) и (10.37) нужно использовать интегральное скалярное 


произведение (10.7) (с множителем или без него, что не иг- 


Ь-а 
рает роли). В результате в представлении (10.36) многочлены 
Ч; (х) должны получаться последовательно, начиная с 40(х)=1, 


Ь 
_ _ ахах ___ мВ 
а1(х)=х = ‚ рекуррентным равенством 
[ах - 
2 Ь 
[хак ак [хак дак сах 


Чк+1(х) = хак (х)- Чк—1(х) 


Ь 2 Ь 2 
ак сах ак дах 
при = 2,й ‚ т-1, а коэффициенты с; должны вычисляться 
Ь 
9; (х)/(х)ах 
по формуле с; „ва при 1=0,1,й ‚т. 
аа 


Рассмотрим теперь случай, когда функция /(х) задана 
таблицей своих значений в точках хо <х|<й <х,„ отрезка 
[а, 6]. Для аппроксимации этой сеточной функции многочленом 


Фурье степени и при т<и на основе формул (10.35)—(10.37) 
используем евклидово скалярное произведение (10.9) (опять-таки 


1 
с множителем РЕГ. или без него), согласно которому, например, 
п-+ 
п п 1 п 
(40, 40)=У1=и+1, (>, 4%) = Ух те. м =——Улх;, итд. 
1=0 1=0 п+1 1=0 


Если при этом степень ит аппроксимирующего многочлена 
О„(х) жестко зафиксирована, то этот случай не имеет принци- 
пиального отличия от предыдущего. А именно, начиная с 


т в | ет 
90(х)=1, а(х)=х-—Ух, со =— УЛ), (0.38) 
п+1;—0 п+1;-0 
при А = 2,й ‚ т-1 вычисляем коэффициенты 
2 
Уно (х;) 
й й 
> 09% (х;) 


0х4 (х;)ак—1(х;) 


В = 
у) 


а = (10.39) 
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и с их помощью конструируем многочлены 45(х), 43(х), ..., 
9т(х) по формуле 
Чк+и(х) = хак (х)- алЧк (х)- Вики (х); (10.40) 


затем при /=1,2,й ‚т вычисляем коэффициенты Фурье 


в _ Уно9/ <) @) (10.41) 


у да 
Уно Ч} (х;) 
для их подстановки в выражение (10.36). 


Заметим, что при т=и получаемый таким образом много- 
член Фурье О,„(х) наилучшего среднеквадратического прибли- 
жения сеточной функции Х(х) на [а, 6] должен совпасть с соот- 
ветствующим интерполяционным многочленом Лагранжа /.„(х) 
(см. (8.6)). Следовательно, многочлен 


0,(®)= Уса ®) 
1=0 


с определенными с помощью формул (10.38)—(10.41) коэффици- 


ентами с ; и ортогональными многочленами 4 ; (х) дает еще од- 


ну форму представления интерполяционного многочлена наряду 
с несколькими другими, изученными в гл. 8. 


Пусть теперь речь идет не о представлении функции Х(х), 
заданной таблицей своих приближенных значений /(х;) 
(1=0,.Й ‚п), многочленом О„(х) определенной степени т, ао 
вычислении ее приближенного значения /(\) в заданной точке 
Те[а, Ь], причем считается, что аяхо<лх<йЙ <х,яЬ и 
Х=Ех;. 

Учитывая, что повышение степени т многочлена Фурье 
О„(х), аппроксимирующего /(х) на [а, 6], улучшает качество 
аппроксимации, т.е. уменьшает величину среднеквадратической 
ошибки (10.16) до тех пор, пока на погрешность метода не станет 
существенно влиять погрешность округлений (вычислений), 
есть смысл совместить процесс вычисления коэффициентов 
Фурье с процедурой ортогонализации в одном цикле и произво- 
дить последовательное вычисление значений О%(х), О!(Х),..., 
все более точно приближающих значение Х(Х). Алгоритм, реа- 
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лизующий такой подход, должен предусматривать вычисление 
на каждом А-м шаге среднеквадратических отклонений 


ря т д-оху 


п- 


и проверку их на убывание при переходе от А к А+1, проверку 
величин О, (Х) на сближение при увеличении К (т.е. того, что 


101 ()- О) <|0,®)-0,1@)), а также того, что А < п. 


Кстати, при небольшом числе узлов, т.е. при небольших 
значениях и, случай А=и можно использовать для проверки 
правильности работы алгоритма. Действительно, в этом случае 
многочлен О’ (х)=О,„(х) должен стать интерполяционным, но 
поскольку он строился из других соображений, сравнение вели- 
чины /(х;)-О„(х;) или ри с нулем не тривиально (не то, что 
при классической интерполяции). 


УПРАЖНЕНИЯ 


10.1. Найдите нормальное псевдорешение системы 
2х1 +3хо —4хз =1.2, 
Зм +х2 +7хз =4.7, 
х| -4х2 —-3х3 =6.1, 
4х +3х2 —5хз =5.2, 
2х1 — 4х) +3х; =7.9. 


10.2. Для функции у= У(х), заданной таблицей 
х 0.5 1 1.5 2 2.5 
У 10.5 1.6 0.55 0.26 0.15 °* 


подберите подходящий вид аппроксимирующей ее нелинейной зависимо- 
сти из следующих: 


а) у=а-х?; 6) у=а:-е 


| 
м; д уа+; Пу= 
х а+вх 


находя методом наименьших квадратов их параметры и сравнивая между 
собой среднеквадратические погрешности. 
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10.3. Постройте наилучшие среднеквадратические линейные 
аппроксимации для функций 


а) 71(@)=\х при хе [0,1], 


6) Л(х)= Ё 


в) /(х)= т +х) при хе [0,1] 
непосредственным применением метода наименьших квадратов. Сравните 
полученные результаты с результатами чебышевской аппроксимации (см. 
упр.9.5): 

А) по величине среднеквадратической погрешности; 

Б) по величине максимальной погрешности на заданном отрезке. 


при хе П, | 


10.4. Функция у= Х(х) задана таблицей 


Методом наименьших квадратов аппроксимируйте данную функцию 
1(х) функцией ф(х)= ад +ах по трем точкам (х=0, х=0.5 и х=1.0), 
по шести (х=0, 0.2, 0.4, 0.6, 0.8, 1.0) и по всем одиннадцати точкам. 
Сравните результаты (в разных метриках) с результатом применения инте- 
грального МНК, зная, что 7(х)= 1а(1 +х) (см. упр. 10.3, в). 


10.5. Покажите, что матрица системы (10.22) при х; = «о, 1], т=1 
п 


и и—> © совпадает с матрицей Гильберта Но. 


10.6. Для функций а-в упр.10.3 на заданных отрезках постройте 
многочлены Фурье первой и второй степени. Найдите среднеквадратиче- 
ские ошибки результатов. Совпадают ли построенные многочлены первой 
степени с линейными функциями, полученными в упр. 10.3? 
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ГЛАВА 11||ИНТЕРПОЛЯЦИОННЫЕ СПЛАЙНЫ” 


Рассматривается высокотехнологичный способ прибли- 
жения таблично заданных функций с помощью составных функ- 
ций, звеньями которых служат многочлены небольших степе- 
ней, допускающие гладкую стыковку. Наряду со ставшими уже 
классическими естественными кубическими сплайнами, здесь 
изучаются интерполяционные параболические (квадратичные) 
сплайны, а также базисные сплайны (иначе, В-сплайны) и эр- 
митовы (локальные) сплайны нечетных и четных степеней. Да- 
ется представление о сглаживании эмпирических данных по- 
средством простейших линейных фильтров и указывается на 
возможность построения сглаживающих сплайнов. 


11.1. КУСОЧНО-ПОЛИНОМИАЛЬНАЯ 
АППРОКСИМАЦИЯ. ЛИНЕИНЫЕ ФИЛЬТРЫ 


В тех случаях, когда промежуток [а, 6], на котором нужно 
подменить функцию /(х) функцией ф(х), велик, и отсутствуют 
основания считать данную функцию /(х) достаточно гладкой 
при хе [а, 6], нет смысла пытаться повышать качество ее поли- 
номиальной аппроксимации за счет использования в роли ф(х) 
многочленов высоких степеней. Более перспективным в этих ус- 
ловиях является применение кусочно-полиномиальной аппрок- 
симации Г(х), предполагающей, что аппроксимирующая функ- 
ция ф(х) составляется из отдельных многочленов, как правило, 
одинаковой небольшой степени, определенных каждый на своей 
части отрезка [а, 6]. При этом, если функция /(х) непрерывна и 
имеется достаточное количество точечной информации о ней, то 
можно рассчитывать приблизить ее на [а, Ь] сколь угодно хоро- 
шо кусочно-полиномиальной функцией ф(х) только за счет уве- 
личения числа частичных промежутков, составляющих [а, 6], 


* х „ 
) Процитируем абзац, с которого начинается посвященный сплай- 


нам параграф в книге [13]: 

«Способ приближения сплайнами интересен, кроме всего прочего, 
отношением к нему специалистов. Одни считают его универсальным ме- 
тодом решения проблем, стоящих перед численным анализом, и ищут 
применения ему в самых различных направлениях. Другие рассматривают 
его как очередную дань переменчивой моде. По-видимому, истина нахо- 
дится где-то посередине». 
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при любых фиксированных степенях составных многочленов и 
любых способах согласования /(х) и Ф(х). 

Использование низких степеней многочленов, составляю- 
щих Ф(х), позволяет легко находить их коэффициенты как из 
интерполяционных, так и из иных условий. 

Так, если заданы значения у; функции у= /(х) на системе 
узлов х, таких, что 

а<хо <х| <й <х, ЗВ, (11.1) 


и требуется аппроксимировать Х(х) кусочно-линейной функици- 
ей ф(х), исходя из условий интерполяции 


Ф(х)= У; (1=0, ЬЙ ‚8 
то, беря функцию ф(х) в виде 
ах+Ы при хЕ[хо, м1 |, 
а2х+Ь> при хЕ|[х1, х> |, 
оу - Н пря ле а] (11.2) 


а,х+Ь, при Е 


для нахождения и пар ее коэффициентов ад, В, (К=Ь2,йЙ ‚п) 
имеем систему из 2и линейных уравнений 


и + =>, 
ам+ы  =У; 
ты + =У, 
а2^Х +5 = У (1 1.3) 


причем, как видим, каждая пара соседних уравнений системы 
(11.3), имеющих коэффициенты с одинаковыми индексами, не 
связана с остальными и может решаться отдельно. 

Аналогично, каждое звено кусочно-квадратичной функ- 
ции (при п=2т в (11.1)) 


ах? +Вх+е при хе[жо, хо], 


2 
Ф(х) = ах +Бох+с> при хЕ[хо, х4], (11.4) 


атх” +их+ст при хе В т-2 Х2т | 
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определяется тройкой коэффициентов ах, Ву, сх (К = 2,йЙ ‚ т), 
которые могут быть найдены последовательным решением 
(при А =1,2,й , т) трехмерных линейных систем 


2 

арх 2 + Врхок 2 + СЕ = Уд, 
2 

арх к-1 + Вх -1 + Ск = УЕ, (11.5) 
2 

архэк + Вх + су = Ук , 


соответствующим выставленным интерполяционным условиям. 

Фактически, в рассмотренных случаях речь идет о последо- 
вательной линейной интерполяции (8.7) по перемещаемым вдоль 
отрезка [а, 6] парам соседних точек разбиения (11.1) и о после- 
довательной квадратичной интерполяции (8.8) по тройкам таких 
точек. 


Пример 11.1. Для функции у = Г(х), заданной таблицей 


х 0 0.5 | 2 3 4 5 
<) | 1.5 0 0 2 2 1 в ^ 


выполним простейшие кусочно-линейное и кусочно-квадратичное интер- 
полирования. 

Осуществляя линейное интерполирование данной функции на каж- 
дом из элементарных промежутков, определяемых соседними числами 
верхней строки таблицы, получаем, что можно считать /(х)= ф!(х), где 


—3х+1.5, хЕ[0, 0.5], 


0 ‚ ХЕ[О.5, 1|, 

6) 2х-2 ‚, хЕ[1, 2], 
Хх] = 

ы 2 , хе[2,3], 


—-х+5 , хе |3, 4], 
х-3 , хе [ 4, $]. 


Квадратичное интерполирование по тройкам известных точек отрез- 
ков [0,1], [1,3] и [3,5] приводит к приближенному равенству 


Л) = ф2(х), где 


3х? —4.5х+1.5, хЕ[0, 1, 
ф5(х) = —х2+5х-4 , хЕ[ 3], 
х? —-8х+17 , хеЕЁ, 5]. 
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Графики функций ф1(х) и $ (х) показаны на рис. 11.1 и 11.2. 


Рис. 11.1. График функции у=Ф1(х) Рис. 11.2. График функции у = Ф>(х) 


Кусочно-линейная аппроксимация таблично заданных 
функций, проводимая на основе метода наименьших квадратов, 
приводит к понятию линейного фильтра. 

Предположим, что функция /(х) задается «длинной» таб- 
лицей своих значений /; = Г(х;) на системе равноотстоящих то- 
чек х; =хо +, и пусть известно, что некоторые из значений }; 
могут содержать достаточно большие случайные ошибки («вы- 
бросы»). Тогда, прежде чем производить какую-либо содержа- 
тельную математическую обработку таких данных (например, 
полученных из эксперимента), целесообразно сначала произве- 
сти их сглаживание, чтобы уменьшить роль выбросов. Рассмот- 
рим вкратце один из простейших подходов к такому сглаживанию. 

Если при кусочно-линейной интерполяции линейная 
функция на элементарном отрезке [х; 1, х;| однозначно опреде- 
лялась по двум точкам из условия совпадения ее значений в 
них со значениями Гр и / данной функции /(х), то здесь 
на каждом из отрезков [х; 1, х;+1| длиной 2й функция Х(х) бу- 
дет подменяться наилучшим линейным среднеквадратическим 
приближением $;(х), построенным по трем значениям },-1, 
и Т-ь и отфильтрованным значением в точке х; будет 
считаться значение ф;(х;). 

Итак, на первом этапе ставим задачу: для функции Х(х), 
представленной таблицей 


х | хм | р 
Р-НА. те 
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где х;=х0+Ш, 1=0,,й ‚и, найти такую функцию ф(х), 
составленную из линейных функций 

Фи(х) = а; +5 (х-х;) 
(с перекрытием), чтобы 

7(>) = ФфИх) У хе [5-1 1+1] 

в смысле 

141 2 , 

> -@Кхь) = тт. 

К=/-1 
Эта знакомая по $ 10.1 задача нахождения коэффициентов 


а;, Б; методом наименьших квадратов решается непосредствен- 
но. Имеем: 


(Да-а +)? +(-а+(Фи-а,-ВВ)? = ши 


т —а; +61) +(-а;)+ (А-а -ЬЙ)=0, 
> 
(Л -а-+ЬА- (Да-а -Ый)й=0. 


1 1 
Отсюда получаем а; = +Л+Л+1), В = (И -Ль. 


Следовательно, на каждом из промежутков [х; 1, х;+1]| 
функция /(х) может быть подменена линейной функцией 


о ел лы ИН 


Варьированием Г от | до и-1 для функции (11.6) таких линей- 
ных функций 0; (х) будет построено и-—1; на каждый элементар- 
ный промежуток [х;, х;+1| (кроме первого и последнего) их при- 
ходится по две. 

Второй этап состоит в пересчете данной таблицы (11.6) за- 
меной значения /; на значение 


оби) + Ан) 


при каждом 1=12,йЙ ‚п-1. Доопределив новую табличную 


функцию, например, значениями Фо (хо):= о и Ф„(х, ):= Х, по- 
лучаем вместо (11.6) табличную зависимость 


х хо х й Я 2: 
ф\х Фо (хо) Фи) й аи | ) ° 
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в которой «в целом» сохраняется характер поведения исходной 
функции Г(х) и уменьшена роль ее отдельных значений. 

Описанная процедура называется осреднением по трем 
точкам и является простым частным случаем линейного 
фильтра. Более глубокое осмысление роли линейных фильтров 
с помощью гармонического анализа можно найти в теории циф- 
ровой обработки сигналов; некоторые элементы такого анализа 
роли фильтров см., например, в [158, 187]. 

Отметим, что осреднение проводят и по большему числу 
точек, а иногда прибегают к двойной фильтрации табличных 
данных; правда, при глубокой фильтрации есть риск потерять 
полезную информацию о таблично заданной функции. 


Пример 11.2. Функция у = Х(х), заданная таблицей 


Г + 
ы --Ф-© 
р р 


---+ 
| 
О 
| 
1 
| 


НВ 


ИЕ ВУИ НЧ ВАН 


Рис. 11.3. Результат осреднения функции по трем точкам 


представляет собой сеточную функцию у=Шлх с систематическими 
ошибками округления в каждой точке сетки, не превосходящими 0.05, и 
двумя выбросами в точках х =1.4 и х=1.8. Осреднение по трем соседним 
точкам, т.е. замена каждого значения данной табличной функции средним 


арифметическим трех ближайших значений, приводит к таблице 
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(где значения, подвергшиеся коррекции, записаны с двумя знаками после 
запятой). Эффект сглаживания, полученный таким простым фильтром, 
можно увидеть на рис. 11.3, где данные приближенные значения /(х;) 


помечены кружочками, а осредненные значения ф(х;) — крестиками. 


11.2. ОПРЕДЕЛЕНИЕ СПЛАЙНА. й 
ИНТЕРПОЛЯЦИОННЫЙ КУБИЧЕСКИИ 
СПЛАИН ДЕФЕКТА 1 


Пусть на отрезке [а, 5] задана упорядоченная система не- 
совпадающих точек х; (К =0, 1,Й ‚п). 


Определение 11.1. Силайном 5„(х) называется оп- 
ределенная на [а,Ь] функция, принадлежащая классу 
(& Га, Ь] 1 раз непрерывно дифференцируемых функций, та- 
кая, что на каждом промежутке [хь_1ь Хк| (К=ЬО,Й ‚п) 
— это многочлен т-й степени. Разность Ч := т-[ между 


степенью сплайна т и показателем его гладкости [ назы- 
вается дефектом сплайна. 


Если сплайн 5„(х) строится по некоторой функции Х(х) 
так, чтобы выполнялись условия 5„(х;) = /(х;), то такой сплайн 
называется интерполяционным сплайном для функции Х(х); 
при этом узлы сплайна ху, вообще говоря, могут не совпадать с 
узлами интерполяции х;. 

Тривиальные примеры интерполяционных сплайнов можно 
найти в предыдущем параграфе: кусочно-линейная функция 
Фф(х), определенная в (11.2) с параметрами ах, В», удовлетво- 
ряющими условиям (11.3), очевидно, является интерполяцион- 
ным сплайном степени | дефекта 1, а кусочно-квадратичная 
функция (11.4) при условиях (11.5) есть интерполяционный 
сплайн степени 2 дефекта 2. 

Совпадение дефекта сплайна с его степенью обеспечивает 
просто непрерывность сплайна. Интерес представляет построе- 
ние сплайнов с большей гладкостью, т. е. с малым дефектом. Та- 
кие сплайны являют собой дальнейшее совершенствование идеи 
кусочно-полиномиальной аппроксимации. 
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Рассмотрим наиболее известный и широко применяемый 
интерполяционный сплайн степени 3 дефекта 1. При этом будем 
исходить из предположения, что узлы сплайна 


а=хо, м, №, Й , Хх, ХНЕВ (11.7) 


одновременно служат узлами интерполяции, т.е. в них известны 
значения функции /у := /(хь), =0,1,Й ‚п. 


Определение 11.2. Кубическим сплайном дефекта 1, 
интерполирующим на отрезке [а, Ь] данную функцию Г(х), 
называется функция 


8(х) = [<= ар + (х хр) + си (и ж+ж 


п 
при хеЕ[хь1,хк]| | (11.8) 
удовлетворяющая совокупности условий: 
а) &(хь)= Тк (условие интерполяции в узлах сплайна); 


6) 2(х)ЕС 2[а, Ь] (двойная непрерывная дифференци- 
руемость); 


в) <"(а) = <"(Ь) = 0 (краевые условия). 


Определенный таким образом сплайн называют еще есте- 
ственным или чертежным сплайном*) и связано это со сле- 
дующим обстоятельством. Желая провести плавную линию через 
заданные точки плоскости, чертежники фиксировали в этих точ- 
ках гибкую упругую рейку, тогда под влиянием упругих сил она 
принимала нужную форму, обеспечивающую минимум потенци- 
альной энергии. Несложно убедиться, что определяемая усло- 
виями а)-в) функция (11.8), представляющая собой кубический 
п-звенник с гладким сопряжением звеньев, служит математиче- 
ским описанием такого чертежного приема. 

С этой целью достаточно показать, что значение функцио- 


Ь 

нала Ф(<) ‚= [(="о)? ак, характеризующее указанную величину 
а 

потенциальной энергии закрепленной в (п+1)-й точке (11.7) 


Ь 
упругой рейки, не превосходит величины Ф(Х)= | ("7 ак, 
а 


* > . > 
) Английское слово 5р/1пте переводится как (гибкая) планка, рей- 
ка, брусок. 
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соответствующей потенциальной энергии закрепленной в тех же 
точках рейки, но принимающей любую другую, отличную от 


у=8() форму у=/(<). 
Более удобно это сделать, рассматривая Ф(7 - <). Имеем: 


р Ь 
Ф(/-в)= [(/"<)- в" =Ф()+Ф(8)-2[ "(<)" = 


а а 
(прибавим и вычтем величину 2Ф(5)) 


Ь 
=Ф(/)-Ф(=)-2[(/"(%)- 8"(х)) "(хук = 


а 
(применим правило интегрирования «по частям») 


ь 
= ®(/)-$(8)-2(/'6)- <)" +210) - =") "бд = 


(при подстановке границ учтем краевые условия в), а к послед- 
нему интегралу применим свойство аддитивности по промежут- 
ку интегрирования) 


-Ф()-Ф(в)+2х |) - оао = 


К! хр 


о-в > але выд = 


(используем условия интерполяции, согласно которым должно 
быть &(хк) = Лк) и 8-1) = Лк) 
=Ф(/)-Ф(=). 
Таким образом, Ф(5) = Ф(/)-Ф(/-), откуда, в силу неотри- 
цательности функционала Ф, следует Ф(=) < Ф(Р). 
Замечание 11.1. Краевые условия в определении 11.2 могут быть 
заменены на другие. Например, можно наложить дополнительные условия 


на первую производную функции &(х) в точках а и 6. В таком случае ку- 


бический сплайн (11.8), оставаясь интерполяционным дефекта 1, утрачи- 
вает свойство быть естественным. 


Для построения по данной функции Г(х) интерполирующе- 
го ее сплайна (11.8) нужно найти 4и его коэффициентов ах, 6%, 
ск, Ах (К=Ь2,Й ‚п). Чтобы понять, имеется ли для этого дос- 
таточное количество связей, расшифруем фигурирующие в опре- 
делении 11.2 условия а)-в) через функции 2; (х), составляющие 
8(х), имея в виду, что в любом внутреннем узле должны 
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совпадать значения двух соседних звеньев сплайна и двух их пер- 
вых производных (см. наглядную структуру сплайна на рис. 11.4). 


„99 о 82(х) рн 8-0) 8 (х) 8и(х) 


хо х 2 Хк-2 ХК ХК Хи-1 


Рис. 11.4. Расположение узлов и звеньев кубического сплайна (11.8) 


Имеем: 
из условий интерполяции а): 


81(х0)= №, 8% )= Лк при К=ЪЬ2,й ‚п; 
из условий гладкой стыковки звеньев сплайна 6): 
В-1(хк-1) = 84-1), 
в) = 8-1), | при =2,3,й ‚п; 
аи) = 8-1) 
из краевых условий в): 
&10)=0, 8(х„)=0. 


Как видим, условий оказалось 4и — ровно столько, сколь- 
ко в записи сплайна (11.8) неизвестных коэффициентов. Под- 
ставляя сюда выражения функций 


2 3 
ве (х)= + (х-хь)+сь@-хь) +а(х-хь) 
и их производных 


24 (х) = +24 (х-хь)+3а, (х-жь)? (11.9) 


8 (х) = 2с, +64; (х-хь) 


через коэффициенты ах, Ву, ск, Ак при указанных значениях ^ 
и полагая для краткости 


Йу АРХ, (11.10) 
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получаем детализированную систему связей 


а-Ый +1? -а® =, (11.11) 
а; = приЁ=Ь2,Й ‚пм, (11.12 
ар = ак -БЫйь + сьИф — Ч, (11.13) 
В =Ь 24, +Зац И? , при =2,3,й,и (11.14 
СЕ = Ср — ЗА , (11.15) 
а -зай =0, (1.16 
ви =. (1.17) 


Теперь ставим задачу выявления эффективного способа на- 
хождения коэффициентов сплайна ах, Ву, ск, Ак (К=Ь2,Й ,п) 
из этой линейной относительно них системы (11.11)-(11.17). С 
этой целью будем исключать из системы неизвестные ах, Ах, В 
и сводить все к решению системы относительно неизвестных ср. 
При этом для упрощения записей используем уже применявшее- 
ся ранее (см. (8.39) в$ 8.6) обозначение разделенной разности 


Ин й. 
ку жк) = АА (11.18) 
И 
и, кроме того, введем фиктивный коэффициент 
си =0. (11.19) 


Итак, согласно (11.12), коэффициенты а,’ известны и рав- 
ны /х при любом КЕ{1,2,й ‚п!. Подставляя их значения в ра- 
венства (11.11) и (11.13), приходим к равенству 


2 3 
Бейк — СкЙк + ЧкЙЕ = Ль — Лиль 
справедливому при А =1,2,й ‚п, откуда с учетом обозначения 
(11.18) получаем выражение 


ВЕ = Лом) +сьйь -ЧК (К=Ъ2,й п). — (11.20) 


Далее, из (11.15) и (11.16), если учесть (11.19), можно одно- 
значно выразить 4» через су: 


Е еж (11.21) 
ЗИ 
С помощью (11.21) избавляемся от 4, в (11.20): 


2 1 
и. =Ло-ьхь) + йьсь + ибь- (&=12,й ,"), (122) 
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Теперь пользуемся связью (11.14), подставляя туда Ву _1, Ву 
из (11.22) и Ах из (11.21): 


о 1 
Р@-2; ж-)+ т 1х 4% 16-2 = 


2 | — с 
= Лу жк) вьск тек = Арс +388 РЕЧКА, 
3 3 ЗИ 


После упрощения отсюда получаем относительно неизвестных 
ск трехточечное разностное уравнение второго порядка 


Пр -лск—2 + 2( кф + Ир) ф-1 + Йкск = 


=ЗЛО-в жк) -З7 0—2}; к-р), (11.23) 


где К=2,3,Й ‚п, со =0 (согласно (11.19)) и с„=0 (соглас- 
но (11.17)). 

К такому же итогу можно прийти и иными путями [134, 
138, 158, 167 и др.]. 

Так как |2, +2й,| заведомо больше, чем |й,_1|+|й% |, то 
для разностного уравнения (11.23) ( по другой терминологии, 
ленточной системы линейных алгебраических уравнений с 
трехдиагональной матрицей коэффициентов) выполняется доста- 
точное условие однозначной разрешимости, т.е. существует 
единственный набор коэффициентов с1, с2, й ‚с„, удовлетво- 
ряющий (11.23). Найдя эти коэффициенты, все остальные коэф- 
фициенты сплайна (11.8) так же однозначно получаем по форму- 
лам (11.12), (11.22) и (11.21). Таким образом, справедлива 
следующая теорема. 


Теорема 11.1. Гри заданных в точках а и Ь краевых 
условиях ( в"(а) = \ь)= 0) ио заданным в узлах 


а=хо, х|1, №, й › Ли» Хи =Б 


значениям 1; (К=0, 1 й,п) функции Г(х) можно по- 
строить единственный интерполирующий ее кубический 
сплайн &(х) дефекта 1. 


Следует отметить высокую технологичность процесса 
сплайн-интерполирования. 

Действительно, упомянутое выше диагональное преоблада- 
ние в трехдиагональной матрице системы (11.23) обеспечивает 
корректность и устойчивость метода прогонки (см $ 2.6 и [3, 
44, 111, 153]. Применение этого метода для решения системы 
(11.23) сводится к вычислению прогоночных коэффициентов по 
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формулам прямой прогонки 

___ № д -З/@в 2) 37%; м) 
+28,’ “' 2 +21, 

Ц т 
21 +2; + Ик _1дк—2 ’ 

_ З/@ии жк) - ЗУ; хи) ИА 


д. Зи мь) ЗУ) 2 
№ 2-1 +24 + Ир 10-2 (11.26) 


бт = 5 (11.24) 


бь= (11.25) 


при К =3, 4,й ‚пи, а затем к получению искомых значений су об- 
ратной прогонкой по формуле 


скл = би1Ск + Ак (11.27) 


полагая в ней К=и, п-1,Й ‚2 и учитывая, что с„ =0. После это- 
го, как уже говорилось, остается подставить с; в выражения 
Ак (11.21) и В; (11.22), а в качестве а; в (11.8) взять значения 
Лк. Все вычислительные затраты на построение и-звенного есте- 
ственного сплайна составят, очевидно, О(п) арифметических 
операций. 

Факт и скорость сходимости сплайн-интерполяционного 
процесса характеризует следующее приводимое здесь без дока- 
зательства утверждение [1, 23, 117, 153, 167] 


Теорема 11.2. Пусть ®(х) — кубический сплайн де- 
фекта 1, интерполирующий на системе узлов (11.7) отрез- 
ка [а,Б]|] четырежды непрерывно дифференцируемую на 
нем функцию ХГ(х). Тогда при любом фиксированном п 
найдется такая постоянная С>0, что для любого 
хе][а, В] 


[7С- (<) С.А, (11.28) 


где А := тах (хр —хк_1). 
1<А<п 

Все расчетные формулы упрощаются в частном случае, ко- 
гда сплайн ©(х) строится по системе равноотстоящих 
узлов. Выпишем всю совокупность формул в естественном для 
вычисления коэффициентов сплайна (11.8) порядке, заменяя в 
соответствующих равенствах (11.24)—(11.26), (11.22), (11.21) пе- 
ременный шаг Й, (11.10) на постоянный шаг й. При этом вместо 
разделенных разностей (11.18) будут использоваться конеч- 
ные разности интерполируемой функции Г(х) (см. (8.19) в $ 8.4). 
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Имеем: 


5, =--, Я=- АЛ; 
4 412 
при К =3,4,й ‚п: 
259 
й —> АЛЬ — Як 
Эь== ‚ Яя ; 
4+ ду 4+ д, _2 


си =0; 
при К=и, и-Ьй ,2: 
Ск = д-1ск + 1; 
при А =1, 2, Й ‚и (с учетом со = 0): 
АЙ, 1 Ск -Су- 
= де А, 
й Зй 


В результате при хе [х/_1, хх| значение Г(х) может быть под- 
менено значением 


[2 + +1) 5 


2 3 
ак (х) = Лк +Ь(х-хь)+ ск (ху) +4 (х-хь) 
с найденными значениями коэффициентов Бу, ск, Ах и погреш- 
ностью о“) в соответствии с оценкой (11.28). 


Замечание 11.2. Если известно, что значения /х приближаемой на 
[а, В] функции Г(х) содержат случайные ошибки, то вместо интерпо- 


ляционного сплайна применяют сглаживающий сплайн. Сглажи- 
вающим сплайном, наиболее близким к естественному сплайну третьей 
степени, является такой кубический п-звенник 53(х), который миними- 


зирует функционал 
Ь п 
Фи) = иода рии), 


где р„>0 — некоторые весовые коэффициенты, от величины которых 
зависит степень сглаживания (или иначе, допустимое отклонение сглажи- 
вающего сплайна от интерполяционного в каждом конкретном узле) [24, 
Пи др.]. Процедура построения сглаживающих сплайнов более сложна, 
и для получения коэффициентов, например, кубического сглаживающего 
сплайна 53(х) требуется решать линейные алгебраические системы с пя- 
тидиагональными матрицами [117, 134]. 
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11.3. КВАДРАТИЧНЫЙ СПЛАЙН ДЕФЕКТА 1 


Следуя [167] (см. также [73, 114 и др.]), будем строить та- 
кой интерполяционный сплайн второй степени, узлы которого не 
совпадают с узлами интерполяции, а перемежаются с ними (за 
исключением начального и последнего). А именно, пусть ап- 
проксимируемая функция Х(х) на системе и+1 точек 

а=хо < <х2 <й <х,=Ь 
— узлов интерполяции — принимает значения Х(ху)= у 
(К=О0,1,й ‚ п), и пусть все внутренние узлы Х, квадратичного 
сплайна р(х) берутся точно посередине между соседними узла- 
ми интерполяции, т.е. 


ы = +), 
а крайними узлами сплайна служат концы отрезка [а, 6]: 
2х =а(=м), Хи =Ь (= хи). 
Таким образом, на каждом из и+1 отрезков [51,7% |, где 
К=1,2, й ‚п+1 (рис. 11.5), сплайн р(х) определяется своим 


звеном ру(х), которое будем задавать квадратичной функцией 
вида 


Рь(х):= ар +Ы(-Ж)+е(-%). (11.29) 


Ри(х) р2(х) Рк(х)  Рк(Х) Р»(х) Риз (х) 


О-о-о > 
ах М Хх №2 ХА ХЕ ХЕ Хр Хи ХК Хи-2 Хи Хи АХ, В 


(= хо )= Хо (= Хи) = Ян 


Рис. 11.5. Расположение узлов и звеньев квадратичного сплайна 


Чтобы квадратичный сплайн 


р(х) = {к (ох), хех 
был интерполяционным для функции /(х) и имел дефект 1, 
нужно удовлетворить условиям интерполяции во всех точках со- 
гласования функций Г(х) и р(х): 


вби )=2 при К =0, Й ‚п, (11.30) 
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и условиям гладкой стыковки звеньев сплайна во всех его внут- 
ренних узлах: 


Рик) = РЕ) 

Рик) = РЕ) 
В совокупности выписанные условия дают Зи+1 уравнений от- 
носительно Зи+3 неизвестных коэффициентов ах, Ву, ск, фигу- 


при А =1,2,й ‚и. (11.31) 


рирующих в выражениях функций р/(х) (11.29), составляющих 
РС). Оставшиеся свободными две связи можно реализовать по- 


разному; остановимся на задании краевых условий на вторую 
производную сплайна*): 

Р(а)=А, рии ()=В. (11.32) 

Продифференцировав дважды функцию (11.29), на основе 


условий (11.30)—(11.32) получаем следующую систему уравне- 
ний: 


= = 59 

ан Ва (хь Хы )-+сыы(хх фХьн) =Ль (&=0,ЪЙ п), 
вы хе а 5 

ан +В Хы) Хун) =ак, ( 


В+ 2 (Хх Ху) ЕВ, 
21 =А, 26+ =В. 


=Ь2,й ,п) (11.33) 


Для более удобного манипулирования с этой системой введем 
шаг интерполяции 

йух Хр ХЕ-1ь (11.34) 
через который выразим фигурирующие в ней величины: 
| 
2 


г 1 г А 1 
хо - м = 2% ХЕ -Хк+1 =——Йк+1, ХЕХ 5-Е ++) 


при К=1,2,йЙ ,ип-|1 и 


= в 1 
хи -Хи=0, 38 —Жн = 58 при А=я. 


* а 

) В [167] показывается, что задание обеих дополнительных связей 
на одном конце промежутка [а, |] приводит к численно неустойчивому 
процессу сплайн-интерполяции. 
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С обозначениями (11.34) система (11.33) приобретает вид 


| ти 
ар +1 — > Иннвьн еее =Ль (=0,1й ,п-1, 
Чй-1 = а 

| | ь 
ар +1 О + И) +4 + т) Ст = ай 


&=Ь2,й ›п-1), (11.35) 


1 1,2 
Чй-+1 Рим РС — Чи, 


Бул — (Ик + и )са1 = ВЕ (К =1,2,й ,п-1), 
6+1 — Ян = Ви, 
2с] =А, 24 = В. 


Результат преобразований этой системы будет приведен 
ниже (см. формулы (11.52)-(11.55)), а сейчас рассмотрим упро- 
щенный случай, когда параболическая сплайн-интерполяция со- 
вершается по системе равноотстоящих узлов. 

Будем считать, что шаг интерполяции й, постоянен и ра- 


вен 2Й, т.е. пусть в (11.34) 
й; =2й УЕ =Е{1,2,й ‚п}. 


Тогда коэффициенты ах, Вл, с; звеньев сплайна (11.29) могут 
быть найдены из следующего частного случая системы (11.35): 


а - += № (Е=О,ЬЙ ,п-1, (11.36) 
аи+1 = Ли, (11.37) 
ат +4й 1 =а (&=12,й ,п-1, — (1138) 
аи-+1 — ИБи+1 си — Чи, (11.39) 
ет Аска =Вк (К=Ь2,Й ,п-1, (11.40) 
Вил — 2+1 = Ви, (11.41) 
24=4А, 26,1 =В. (11.42) 


Как и в предыдущем параграфе, будем исключать из урав- 
нений системы неизвестные ах, Ву и сводить всё к связям между 


неизвестными сх. 
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Так как из (11.36) 
а = И -И2 с 1+Л при К=О,ЬЙ ,и-1, 
и следовательно, 
а =, пе + а при К=Ь2,Й м, (11.43) 
то, воспользовавшись этим в равенстве (11.38), имеем 
Рбрт — И’ерыи + Ль АВЕ + Иск — Ле — Арал + 41 су =0, 


т.е. при любых КЕ {1,2,й ‚п-1} справедливо равенство 


ИА 
+1 = Исх + Зйсь+1 + | (11.44) 
(напомним, что А/у_| := Лк — Лк_1 — конечная разность первого 


порядка функции /(х) ). Рассматривая (11.44) совместно с ра- 
венством (11.40), получаем 


д 
26; = Ис — Иер. + — при А=Ь2,й ,и-1, (11.45) 
и значит, 
ди, 
261 = Йсь1 — ЙСу +2 -— при К=0,1й ‚и-2. (11.46) 


Подставим (11.45) и (11.46) в равенство (11.44) (предварительно 
умноженное на 2): 


21 


А + Ис — Ясуо АЙ 2 + бИср 1 Зе т 


те —Рер + 


Отсюда после приведения подобных членов, деления на р и вве- 


дения конечной разности второго порядка р =АД; -АХ 1 
приходим к трехточечному рекуррентному равенству 
2 
А” 
ср + бел + со = Л ь (11.47) 
й 


связывающему неизвестные величины с) при к =1 2, й ;п-2. 


При последнем из допустимых в (11.47) значений А =и-2 
получается уравнение, содержащее неизвестные си_0, си_| И си. 


Чтобы вывести уравнение, связывающее с„_|, сии си. , вос- 
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пользуемся незадействованными еще соотношениями (11.37), 
(11.39) и (11.41). 


Сначала подставим а =ХГ, и а, =ЙЬ, - 2, 9 ж- 
(см. (11.36) при А=и-1) в (11.39), в результате чего получим 
А 1 
й 


Рассматривая это равенство совместно с (11.41), т.е. с 
Вит - В, = 2йси +1, находим выражение 


А/и-1 
=> ь 


Вы -1 +5; = Ис» + Йси.1 + 


26, = си — си. 1 + (11.48) 


Теперь обратимся к равенству (11.45), согласно которому при 
К =и-1 имеем 


АХ, 
261 = йси_1- Иси и (11.49) 
Но, в силу (11.44) при А =и-1, должно быть 


24 

25, +261 = 2 _1 + 6йс„ + и 

Складывая равенства (11.48) и (11.49) и сравнивая полученное с 
последним равенством, после упрощений приходим к равенству 


р 
А_7-2 
и2 
имеющему абсолютно ту же структуру, что и (11.47); иначе го- 

воря, (11.50) — это (11.47) при А =и-1. 

Итак, собирая воедино формулы, нужные для цельного 
описания процедуры построения интерполяционного квадратич- 
ного сплайна 


с +66, +, = , (11.50) 


Р(х):= { ро, херь 


дефекта 1 по системе равноотстоящих с шагом 2й узлов интер- 
поляции хх и узлов сплайна Хх, =х„_1 +й, имеем следующее. 
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Решая трехдиагональную систему 


24 =А, 
2 
А 
66 + сз =“ ЛА, 
й 2 
2 
себе, 
не (11.51) 
2 
ско +6с, = Ва, 
р 
А В 
с,_1+6с, = 8 - > 
26:1 = В 


(например, прогонкой, которая здесь заведомо корректна и ус- 
тойчива), находим коэффициенты с; (К =1,2,й ‚п+1) звеньев 


сплайна р,(х) (11.29); обоснованием этой системы служат 
формулы (11.42), (11.47), (11.50). По известным с; далее вычисляем 


й 1 АЕ 
Б = (с -с +-—— при К=12,й ‚п 
Г. о Г. +1) в р 
в соответствии с (11.45) и (11.48); после этого находим 
Ме =Б, + Вй 


на основе (11.41) с учетом (11.42). Последними вычисляются ко- 
эффициенты ах (см. (11.43) и (11.37)): 


ар =ЖЬ, —-йсь)+ 1 при К=1,2,Й ‚п, 
аи+1 = Ли. 


Замечание 11.3. Если сравнить систему (11.51) с аналогичной сис- 
темой, получающейся из (11.23) при Йх =Й в случае построения куби- 
ческого сплайна по равноотстоящим узлам, можно заметить, что в сис- 
теме (11.51) более ярко выражено диагональное преобладание; это 
позволяет надеяться на лучшую численную устойчивость процедуры на- 
хождения коэффициентов квадратичного сплайна. 


Вывод формул для получения коэффициентов ср, Ву, ах в 
общем случае переменного шага интерполяции Йх из совокупно- 
сти условий (11.35) не вызывает затруднений и производится 
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аналогично продемонстрированному выше выводу. Итогом явля- 
ется следующая ленточная система (где /(ху_1; к; хр) — раз- 
деленные разности второго порядка, построенные по значениям 


ЛЕ-т» ЛЬ Ли): 


251 =А, 
АЙ 
Зе +— 2—4 =4 хо; м; 2), 
же ^ И} 1 #8) 2 +21, 
Е со +3с3 + 73 сд =4/( ) 
3 = м; №2; Хз), 
Йо +13 ы 2 Йо +13 Е а 
ас ооо ооо Ех (11.52) 
Й-2 Ир 
бро +36, 1+ со им. 1), 
А п-2 п-1 НИ, п У п-3, ^и-2 п-1) 
1 ВИ, 
о, 1+3с, =АИх хх), 
И, и—1 п К И—2, ^п- п) 1+2, 
26 =В. 


Решив ее относительно величин с, служащих коэффициентами 
при вторых степенях звеньев сплайна р,(х), далее вычисляем 
коэффициенты Б, при первых степенях, полагая К =1,2,й ‚ив 
равенстве 
1 
и = о — +1) + ЛОХ), (11.53) 
а затем 


| 
бы = в, +. В®,, (11.54) 


и, наконец, свободные члены а) квадратных трехчленов ру (х), 
составляющих сплайн р(х), находим с помощью равенств 


1 1 
ак ны = + (1 1.55) 
ге д=Ьой,й и аи=ЕХ,. 


Проведенные выкладки и их результаты можно рассматри- 
вать как доказательство существования и единственности квад- 
ратичного сплайна дефекта 1, интерполирующего на отрезке 
[а, В] заданную на нем своими значениями /, функцию Х(х) 


при заданных краевых условиях (11.32). Ряд утверждений о 
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сходимости таких сплайнов к функции Х(х) на [а, 6] с тем или 
иным порядком относительно Йй->0 в равномерном и 
А := тах(хр —х_1) —> 0 в неравномерном случаях, в зависимости 
от требуемой гладкости Х(х), можно найти в [167], причем в 
этих утверждениях даются оценки близости в точках хе [а, Ь] не 
только /(х) и р(х), но и их производных*). В простейшем виде 
утверждения подобного рода качественно отражает следующая 
теорема. 

Теорема 11.3. Пусть функция Г(х) дважды непре- 
рывно дифференцируема на отрезке [а, Б] и пусть р(х) — 
квадратичный сплайн, определяемый условиями (11.30)- 
(11.32). Тогда при каждом фиксированном п найдутся та- 
кие положительные постоянные с, с1, со, что при любом 


хе [а, Ь] 
2 
17%) ро] < соА", 
ИО @)-Р06 ке?" (@=Ъ2), 
где А:= тах (хр - ху). 
КЕЙ , п} 
При этом теорема сохраняет силу и в случаях, когда крае- 
вые условия (11.32) на вторую производную р(х) подменяются 
соответствующими условиями на первую производную 


Р(а)=А, ри. ЦВ)ЕВ. (11.56) 
или периодическими краевыми условиями**) 
(а) = 06), где 1=1,2. 


Замечание 11.4. При построении интерполяционного квадратичного 
сплайна дефекта 1, соответствующего требованиям (11.30), (11.31) и 
(11.56), более удобным может оказаться подход, при котором вычисление 
коэффициентов ах, Ву, сх сводится к применению метода прогонки для 
нахождения значений Бу; (а не с») из аналогичной (11.52) системы с по- 
следующей подстановкой их в формулы для получения ах и сх. 


®) Отметим кстати, что существуют оценки близости производных 
НКЦИИ х и кубического сплайна 8х), подооные утверждаемым 
б б 
теоремой .3 для квадратичных сплайнов р 
р 3 р р 
** > 
) В последнем случае точка а не должна быть узлом сплаина. 
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11.4. БАЗИСНЫЕ СПЛАЙНЫ 


Без сомнений, можно построить ряд других сплайнов, по- 
добных рассмотренным в предыдущих параграфах кубическим и 
квадратичным сплайнам, которые обладали бы теми или иными 
заданными свойствами, связанными со свойствами интерполи- 
руемых ими на отрезке [а, 5] функций Х(х). Среди таких сплай- 
нов более высоких степеней стоит особо отметить, пожалуй, 
лишь сплайны степени 5 дефекта 3, играющие важную роль в 
приложениях. Существует достаточно общая и глубокая теория 
сплайнов, изучающая их свойства, представления, сходимость и 
т. п. [1, 91, 114, 167 и др.]. Имеется много разработок в области 
практических применений сплайнов [18, 24, 73, 82, 134 и др.]. 

Остановимся на нескольких специфических конструкциях 
кусочно-полиномиальных функций, тоже именующихся сплай- 
нами (с некоторыми уточняющими их особенности прилагатель- 
ными) и определенным образом связанные с обычными сплай- 
нами. 


Определение 11.3 [167]. Базисным сплайном или, 
короче, В-сплайном степени т-1 (дефекта 1) отно- 
сительно узлов ху <Ху1<Й < хр. т называется функция 


Вт к(х)= Вы 1 ХК п; Хк+тз х) = 


К+т (х; — о 


— ы 11.57) 
та т” 
где 
к-т = [шах{ 0; (м -х) "1, (11.58) 
Пи, к (х) = (ххх й хм). (1.59) 


Посмотрим, что представляют собой В-сплайны от нулевой 
до третьей степени в более простом, но и более употребительном 
случае равноотстоящих узлов В-сплайна, т.е. когда 


ХЕЫЕХЕ +, где 1=0, .й „т. 


Сопоставляя обозначение (11.59) с встречавшимся ранее 
аналогичным обозначением (8.10), без труда «расшифровываем» 
знаменатели дробей в (11.57): ПИ, д (х;) — это произведение раз- 


ностей между узлом х; и всеми остальными узлами от хх До Ху. 
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Числители этих дробей в соответствии с (11.58) есть 


т-—1 
(м-х"" = (;-)_ прихзх, (11.60) 
0 при х>х;. 


Дальнейшую детализацию выражений В-сплайнов (11.57) 
будем производить, придавая параметру т значения 1, 2, 3, 4. 


1) Пусть т =Т. Тогда из (11.57) имеем (считая, что 00 ;= 0): 


0 0 
@-—х). @ы-») 
Вок (х) = Вобжеу жа = 
о < О т 


Е, при х<хи, 


й 


т_1 11.61) 
0+—=— при хр <х< ху (11. 
т ри Хх} К 


0+0=0 при ХЕ 
Таким образом, В-сплайн нулевой степени представляет собой 
функцию-«ступеньку» (рис. 11.6)*). 


Ы®Ымнж 


1 
й й 
мА 
ХА Хр 
Рис. 11.6. В-сплайн нулевой степени 


2) При т=2 из (11.57) следует 


(к -х), 


Ву к(х) = Ва (ху хи Хо = 2+ 
(хк — хи (Е — хк+2) 


* [А > С 
) Это единственный из базисных сплайнов (11.57), изменяющий 
свои значения скачком. К какому из узлов хх или х/_| отнести ненулевое 


1 
значение — — вопрос договоренности. То же можно сказать об (т-1)-х 


производных В-сплайнов (т — 1)-й степени. 
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1 
(Жт-х (но -х 


ОД НЫ Г — 
(кл — хе) — хЕ+2) но хо - Хь) 


1 
= 9 -2). -ИЖьн-х), +6 -—), | 
В соответствии с (11.60) последнее можно представить в виде 


1 
— и В +2х-+ хр +2 —х), если ЗА, 

1 
— (02х41 +2х+х,.2-х), если хх 5х Хр 
р 


1 
—(0-0+х%-2 —х), если ХЕ 3 Яро 


0, если х>ху,2. 
Простыми упрощениями получаем окончательное выраже- 
ние линейного В-сплайна: 
Ву к(х) = Ви(хк; кл; Хр; х) = 
0 при х< ху, 


1 хх 
. и а при хр < хх, 
1 
й 


(11.62) 


СХ 
и2 
0 при х>ху+2. 


при хи +1 < ХЗ 2+2, 


Нетрудно представить геометрическое изображение линей- 
ного В-сплайна (рис. 11.7) — это так называемая функция- 
«крышка» (по-другому, функция-«шапочка» [31]). 


Хк й Хк+1 й Хк+2 


Рис. 11.7. Линейный В-сплайн 
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3) Полагая в (11.57) т=3 и выполняя несложные преобра- 
зования, выясняем, как выглядит квадратичный В-сплайн: 


В», к (х) = Во (хук; Хк+1; Хк+2; Хказ; Хх) = 


5-56 -*), + =) -5 +2 =); Е —х), |= 


0 при х<х,, 
1 1 2 
ор ан ен —х)° при хк <х < ху, 
11 1 7 
= эра 9+ ча —х) при хи -1 ХХ 2, (1 1.63) 
1 2 
оз —х) при х+2 <х<у+з, 
0 при х> хз . 


График такого сплайна изображен на рис. 11.8. Для его построе- 
ния предварительно находим 


й- (хх), ххх, 
В>.к(х) =—1-й+ 2(%4+2 —х), хин ХЗ Ху+2, 
— (ЖЗ -х), — Хьн2 ЗхЗз, 
откуда следует, что производная функции В› ; (х) непрерывна во 


3 й 
всех ее узлах и что пах) в точке х=хи.1 #_— 


й 
= Жо. —=—5 Из выражения второи производнои 


] ле, 
и 
ВЗи(х)=—4-2, ху < +2, 
Хр << Хун 
видим, что выпуклость функции В> (х) изменяется в узлах 


скачком. 


ХА Хк+1 Хк+2 Хк+3 


Рис. 11.8. Квадратичный В-сплайн 
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4) При т=4 аналогичным образом нетрудно получить из 
(11.57) кубический В-сплайн 


1 р 
Ву, к (х) - - 8 4-Х +6 - д 


3 3 
- 43-х +@ 4-23 |= 


0, Хау, 
1 3 
(5 -хь) ‚ ХК <<, 
6и 
1 1 
В + (хх) 
1 3 
пож) ‚ Мы “ХХ, 
1 1 1 2 
вии 3 а в == 
1 3 
ее —х), хр Заз, 
1 3 
— Сна -х)., Хз ХЗ Х{+4, 
6й 
0, Х>Ху4д. 


Так же легко убедиться, что базисный сплайн третьей степени 
имеет непрерывными не только первые производные, как преды- 
дущий, но и вторые. График этого сплайна представлен на 
рис. 11.9%). 


Рис. 11.9. Кубический В-сплайн 


Являясь линейно независимыми функциями, В-сплайны 
определенной степени образуют базис в соответствующих 


* > > > КР 
) Выведенный здесь из общей формулы кубический В-сплайн отли- 


|: 2 
чается от аналогичного сплайна, например, из [138] множителем ты 
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функциональных пространствах, что оправдывает их название и 
говорит о возможности представления через В-сплайны других 
функций этих пространств. Интуитивно ясно, что любая кусоч- 
но-постоянная функция на отрезке, составленном из равных 
промежутков длины й, может быть единственным образом пред- 
ставлена линейной комбинацией В-сплайнов нулевой степени 
(11.61), любая кусочно-линейная — В-сплайнов первой степени 
(11.62), и т.д. Эти факты могут быть четко сформулированы и 
строго обоснованы. Например, для изучавшегося в $ 11.2 естест- 
венного сплайна справедливо следующее утверждение [138]. 


Теорема 11.4. Пусть (х) — кубический сплайн (11.8) 
дефекта 1, построенный по системе равноотстоящих 
узлов хр =хо+АЙ (К=0,1Й ‚п). Тогда найдутся такие 
постоянные @, ,й ‚ро, что 


п+2 
&(х) = Уа,Вз,-з(х). (11.64) 
1=0 


Заметим, что для построения функций Вз _з(х), Вз_›(х), 
Вз,1(х) и Ву „_з(х), Вз„_2(х), Вз и 1(х) в (11.64) требуется вве- 
дение вспомогательных точек сетки (за пределами отрезка [а,6]) 
Х_3, Х_2, ХЛИ Хи-1, Хи+2, Хи+3 СООТВеТСтвенно. 

Приближение функций линейными комбинациями базис- 
ных сплайнов позволяет запоминать лишь коэффициенты &; 
этих комбинаций. Вычисление же их, в свою очередь, может 
осуществляться достаточно эффективно, в силу очевидной лен- 
точной структуры матриц линейных систем, к которым сводится 
нахождение &; приравниванием левых и правых частей равенств 
типа (11.64) в узлах сплайнов х=хь. 

В-сплайны играют огромную роль при построении числен- 
но-аналитических методов решения дифференциальных и инте- 
гральных уравнений. В частности, линейные В-сплайны (11.62) 
лежат в основе весьма популярного метода конечных элементов 
(см. гл. 17). 


11.5. ЭРМИТОВЫ (ЛОКАЛЬНЫЕ) СПЛАЙНЫ 


Предположим, что у аппроксимируемой функции у = Х(х) 
в точках х,х,й ‚х„Е[а,Ь] известны не только значения 
У0, Уз й , Ул» НО и значения производных до т-й включительно, 


т.е. функция у = /(х) задается таблицей 
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(11.65) 


Как известно (см. $ 8.8), по этой информации об Г(х) мож- 
но построить единственный интерполяционный многочлен Эр- 
мита степени (ип+1)(т+1)-1. Даже при сравнительно небольших 
значениях и и т эта степень может оказаться неоправданно вы- 
сокой. Здесь имеется в виду как сложность построения и эффек- 
тивного использования многочленов Эрмита высоких степеней, 
так и повышенные требования к гладкости функций, для кото- 
рых они должны служить приближениями. 

Применение в таких случаях обычных интерполяционных 
сплайнов высоких степеней и малых дефектов дает нужную 
гладкость интерполируемой функции, т. е. самого сплайна, но не 
обеспечивает согласования его производных с данными произ- 
водными функции Х(х). 

Напрашивается сведение воедино этих двух способов ап- 
проксимации функций, т.е. образование гибрида интерполяци- 
онного сплайна и интерполяционного многочлена Эрмита. Такие 
гибриды называют эрмитовыми сплайнами. 

Глядя на таблицу (11.65), в соответствии с полученным из 
$ 8.8 представлением об эрмитовой интерполяции, легко вообра- 
зить, что по данным в точках хо и х| значениям функции о и 
ее т производных можно построить единственный многочлен 


Эрмита Н}„.1(х) степени 2т +1, по данным в точках х| и х> — 


многочлен такой же степени Н. В +1(х), ит. д. Поскольку каждый 
из этих многочленов — звеньев эрмитова сплайна 


бт = {На д, хех (11.66) 


— строится независимо от остальных, такие сплайны называют- 
ся иначе локальными сплайнами. 

Свойство локальности эрмитова сплайна дает определенные 
преимущества при его построении, особенно в случае большого 
числа и элементарных промежутков [х; 1, х; |, а также позволяет 
составлять эрмитов сплайн из звеньев разных степеней, если на 
каких-то участках промежутка интерполяции [а,Б] функ- 
ция /(х) представлена производными одного порядка, а на 
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других — другого порядка. При этом заметим, что в точках сты- 
ковки таких участков допустимо использование односторонних 
производных. 

Посмотрим, что собой представляет эрмитов сплайн, на- 
пример, третьей степени (эрмитов сплайн первой степени, по 
сути, определен в $ 11.1 формулами (11.2)—(11.3)). 

Считая, что на 1-м элементарном промежутке функция 
у = Х(х) задается таблицей 


х 3% а 
2-1 У 
х У У 
полагаем в (11.66) т =1, и 1-е звено сплайна 53(х) ищем в виде*) 


Й 


НЗ(х) = 0 + (хм) а5 (хх) +44 (х-ж1)*. (11.67) 
_ Два уравнения для нахождения коэффициентов многочлена 
Нз(х) получаем из интерполяционных условий Нз(х;_1)= у, 
Ну(х;) = у;, а именно: 
ай =у:1ь (11.68) 
ана ча? +942 =у, (11.69) 
где й; =х; —х; 1. Далее дифференцируем (11.67): 
(#3) = аа и хр лчза (им, 
и из условий (ы:) (1) = У (ы:) (х;) = у; получаем еще два 
уравнения: 
Ч =уУ1ь (11.70) 
а +2абй; +ЗаА И? = у. (11.71) 
Равенства (11.68) и (11.70) уже определяют первые коэф- 


фициенты многочлена Н3(х). Подставив их в оставшиеся равен- 


ства (11.69) и (11.71), легко находим третий и четвертый 
коэффициенты: 


Г 1 ' ' 
а 2, ЗУ -2й, 1-й), (11.72) 
, 
Г 1 ' ' 
аз = т У = 2у; Е Й; У: Е й;у!). (1 1.73) 
1 
*) Здесь { — определяемый номером узла индекс, а не показатель 
степени. 
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Обратим внимание на то, что формула (11.66) определяет 
эрмитов сплайн заведомо нечетной степени. Для построения 
эрмитовых сплайнов четных степеней постановка задачи не- 
сколько видоизменяется. 

Как и в случае рассматриваемых ранее (см. $ 11.3) квадра- 
тичных интерполяционных сплайнов, будем строить эрмитов 
сплайн 5>„(х) для заданной таблицей (11.65) функции у = Х(х), 
вводя дополнительные узлы 2; между данными узлами интерпо- 


ляции х;_р и х;; для простоты будем считать, что 2; находится 
точно посередине между х;| и х;. Тогда одно звено С>и(х) 


сплайна 5›„(х) на элементарном промежутке [х;_1, х; | составля- 
ется из двух многочленов: 


| Е | 6 
Р2т(х) = а в +ат(х-х;1) ы" 
если хЕ[х;_1, 2:|, 
бт (х)=1 | а 2т 
92т(х) = +Ы(х,-х)+ё +62т(;: -х)”, 


если хе [2;, х;|. 
Для нахождения 2(2т+1) коэффициентов  многочленов- 
полузвеньев ри (х) и 9„(х) 1-го звена С›„(х) сплайна 55 (х) 
(дефекта т) привлекаются 2т + 2 интерполяционных условия 


‚0 ; - р 
(С, ео =УФ, ©) ар =уФ О=ьЬй ,т) 
и 2т условий гладкой СТЫКОВКИ полузвеньев в точке 2у: 


р-р О=оья ,2т-Ь. 


Несложно доказать, что такие коэффициенты могут быть одно- 
значно найдены без привлечения информации с других проме- 
жутков, что означает возможность построения локальных сплай- 
нов четной степени. 


Построим квадратичный эрмитов сплайн, пользуясь теми 
же данными, которые использовались при построении кубиче- 
ского эрмитова сплайна. 

Представляя /-е звено эрмитова сплайна 55(х) многочле- 
нами 


25 (х)=а чаи аб», если хе [х; 1, 2;| , (11.74) 
и 


92) =ы+ы(х,-х)+Ы(:-х), если хЕ[2,х;|, (11.75) 
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дифференцируем их: 


(2) (= а! + Зе -ж 1, 


(1) сд =-Ы -2@;->. 
Далее на основе равенств 
Р(ж)=Ураь (= У 
4()=у,  @ФУб)=У, 
Р2(2:)=45(2‚), (РУК) = (95) (2), 
полагая 2; -х1=х;-2; =, устанавливаем связи между из- 


вестными величинами у;_1, У;, Ут, У; и неизвестными коэф- 


фициентами а0, @1, а>, 60, , 5> 1-го звена искомого сплайна: 


ао = У, 
а = 1, 
Ы = 
< т 11.76 
Ы =-у,, ( ) 


‚Зы а Ч аз Ша: 
40+] + „#2 = + ВЫ +,НЬ, 
а +ва =-Ы -ВЫ. 


Первые четыре уравнения полученной системы (11.76) представ- 
ляют собой явные выражения первых четырех коэффициентов 
многочленов (11.74) и (11.75); подставив их в последние два 
уравнения, находим оставшиеся два коэффициента: 


Г 2 1 1! ! 
а =— (у -у-)-5-0!+3У-у, ыы 
й; 2; 
бит) +в +11). (11.78) 
й; 21; 


1 
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Пример 11.3. Рассмотрим приближение кубическим и квадратич- 
ным эрмитовыми сплайнами функции у=зшлх на отрезке [0, 1], если 
информация о ней представлена следующей таблицей: 


== |е|= 


Полагая {=Т и 1=2, по формулам (11.68), (11.70), (11.72) и (11.73) 
находим коэффициенты кубического эрмитова сплайна, подстановка ко- 
торых в (11.67) дает 


Н1(х)=пх+(12-4л)х? +(4л —16)х3 при хе [05| 
53(х)= 12 13 | 
НЗ (@)=1 +@=-1{х-7) +6-4{х-5) при хе |5, | 

2 2 2 
Аналогично, с помощью вычисления коэффициентов по формулам 


(11.76)—(11.78) с последующей их подстановкой в (11.74)-(11.75), прихо- 
дим к квадратичному эрмитову сплайну 


а 
р (х)=лх+ (8-37) хх" при хЕ| 0, +1 


адин -в(1-+) а 
Нс-на-в (1 при хе 


2 
42 (х)=л(1-х)+(8-3л)(1-х)? при хе 


Е 


5 (х) = 


И 


|| - 


о-в - 


Точность аппроксимации функции зтлх и ее производной л с0$ лх 
с помощью построенных эрмитовых сплайнов 53(х), 55(х) и их произ- 
водных покажем в двух вы точках а ее 
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Как видно из итоговой таблицы примера 11.3, эрмитова 
сплайн-интерполяция дает неплохие результаты. Это хорошо со- 
гласуется с имеющимися утверждениями о сходимости эрмито- 
вых сплайнов 5и-1(х) и 5›т(х) к интерполируемым ими функ- 


нео 


циям Г(х)е Ста, 5] с оценкой погрешности О(тахй;) и 


О\(тах д.78 соответственно (см., например, [91, 167]); для бо- 


лее гладких функций /(х) подобные утверждения устанавлива- 
ют близость соответствующих производных до т-й степени 
включительно. 


УПРАЖНЕНИЯ 


11.1. Выведите формулу осреднения (линейный фильтр) по пяти 
точкам. Примените ее для сглаживания данных примера 11.2 
$ 11.1.Результаты сглаживания отобразите графически; проведите визу- 
альное сравнение с результатами осреднения по трем точкам 
(см. рис.11.3). 


11.2. Постройте линейный сплайн 5\(х), интерполирующий функ- 
цию /(х), заданную таблицей 


х 0 1 2 Э 
т Е Е ЕВ Е 
Выразите 51 (х) через линейные В -сплайны (см.(11.62)). 


11.3. По данным упр. 11.2 постройте кубический и квадратичный 
интерполяционные сплайны дефекта 1, полагая /”(0) = /"(3)=0. 


11.4. Выведите совокупность формул для построения квадратичного 
интерполяционного сплайна при краевых условиях типа (11.56) и посто- 
янном шаге х; —х,_| =Й, в основу которой легло бы решение трехдиаго- 
нальной системы относительно коэффициентов 6; звеньев сплайна (11.29) 
(см. замечание 11.4). 


11.5. Постройте квадратичный сплайн дефекта 1, узлы которого 
хо, х,й , х„ совпадали бы с узлами интерполируемой им функции Х(х) 
[23]. 


11.6. Докажите справедливость формул, фигурирующих в записи 
кубического В-сплайна Вз, к (х). 


11.7. Запишите представления и системы уравнений для вычисления 
коэффициентов этих представлений эрмитовых сплайнов пятой и четвер- 
той степеней. 
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ГЛАВА 12 ||ЧИСЛЕННОЕ ИНТЕГРИРОВАНИЕ 


Выводятся и изучаются методы приближенного вычисле- 
ния определенных интегралов, опирающиеся на суммирование с 
теми или иными коэффициентами значений подынтегральной 
функции. А именно, рассматриваются квадратурные формулы 
прямоугольников, трапеций, Симисона, Чебышева, Гаусса. Осо- 
бое внимание уделяется построению эффективных алгоритмов, 
приводящих с минимальными вычислительными затратами к 
значению интеграла наперед заданной точности. В их основе — 
принцип Рунге практического оценивания точности двойным 
счетом с разными шагами и простые соотношения между не- 
которыми квадратурными формулами. Затрагивается также 
проблема вычисления несобственных интегралов. 


12.1. ЗАДАЧА ЧИСЛЕННОГО ИНТЕГРИРОВАНИЯ. 
КВАДРАТУРНЫЕ ФОРМУЛЫ 
ПРЯМОУГОЛЬНИКОВ 


Пусть требуется найти значение / интеграла Римана 
Ь 
| 1()ах для некоторой заданной на отрезке [а,Б] функ- 


а 
ции Г(х). Хорошо известно, что для функций, допускающих на 
промежутке [а, Б] конечное число точек разрыва первого рода, 


такое значение существует, единственно и может быть ф ор- 
мально получено по определению: 


И 
Г= Ши > 1 (8х; - хр), (12.1) 
и > 
где {х; } о — произвольная упорядоченная по возрастанию сис- 
тема точек отрезка [а, Ь] такая, что 


тах { хо фа, хх -х, 6-х} -0 при по, 


а &, — произвольная точка элементарного промежутка [х;1, х; |. 

В математическом анализе обосновывается аналитический 
способ нахождения значения / с помощью знаменитой формулы 
Ньютона-—Лейбница 


1= Е) - Е(а), (12.2) 


где Р(х) — некоторая первообразная для данной функции /(х). 
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К сожалению, применение этого весьма привлекательного под- 
хода к вычислению / наталкивается на несколько серьезных 
препятствий. Самое главное из них — это несуществование пер- 
вообразной среди элементарных функций для большинства эле- 
ментарных функций Г(х); например, таким способом не удается 
вычислить 
Ь В 2 * 
а -2В ‚ [е ‘4 ити. ) 
а 


Если ни Е(х) для заданной функции Х(х) все же 
найдена, то вычисление двух ее значений Е(а) и Е(Ь) может 
оказаться более трудоемким, чем вычисление существенно 
большего количества значений /(х). 

Поскольку в общем случае значения функций находятся 
лишь приближенно, использование точной формулы (12.2) 
приводит к приближенному результату, который может 
быть более эффективно получен с помощью какой-либо специ- 
альной приближенной формулы на основе значений подынте- 
гральной функции /(х). Такие специальные приближенные 
формулы для вычисления определенных интегралов называют 
квадратурными формулами (механическими квадратурами) 
или формулами численного интегрирования. Первый из этих 
терминов можно связать с геометрическим смыслом определен- 

Ь 
ного интеграла: вычисление /:= | /(х)х при /(х)>0 равно- 


а 
сильно построению квадрата, равновеликого криволинейной 


трапеции с основанием [а, Ь] и «крышей» Х(х). 


Простые квадратурные формулы можно вывести непосред- 
ственно из определения интеграла, т.е. из представления (12.1). 
Зафиксировав там некоторое и>1, будем иметь 


[= УЛ), =) (12.3) 
Е 


Это приближенное равенство назовем общей формулой прямо- 
угольников (площадь криволинейной трапеции приближенно за- 
меняется площадью ступенчатой фигуры, составленной из пря- 


*) По значимости с этим препятствием к принятию формулы (12.2) 
может конкурировать разве что возможная дискретность задания подын- 
тегральной функции Г(х), довольно характерная для многих реальных 
приложений определенного интеграла. 
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моугольников, основаниями которых служат отрезки [х; 1, х;|, а 
высотами — ординаты /(&,;), рис. 12.1). 


у---=-и 


ам м 62 2 Хи-2 ИЕ Хи-1 5 Хп Ь 
Рис. 12.1. Геометрическая интерпретация общей 
формулы прямоугольников (12.3) 


Чтобы из общей формулы (12.3) получить конструктивное 
правило приближенного вычисления интеграла, воспользуемся 
свободой расположения точек х;, разбивающих промежуток ин- 
тегрирования [а, Ь] на элементарные отрезки [х; 1, х;|, и свобо- 
дой выбора точек &; на этих отрезках. 

Условимся в дальнейшем (до $ 12.6) пользоваться равно- 
мерным разбиением отрезка [а, Б] на и частей точками х; с ша- 


гом й= ‚ полагая 


п 
хо=а, х=ма+й (1=12,й п-П), х=6Б. (12.4) 
При таком разбиении формула (12.3) приобретает вид 
п 
Тв, 7 (6;); ЧЕ[м-ьх| (12.5) 
1 
Теперь дело за фиксированием точек &; на элементарных отрез- 
ках [х; 1, х; |. Рассмотрим три случая. 


1) Положим &; =х; 1. Тогда из (12.5) получаем 


И 
ГГ = ПУ). (12.6) 
и 
2) Пусть в (12.5) &; =х;. Тогда имеем 
И 
Ри" =». (а). (2.7) 


1=1 
Формулы (12.6) и (12.7) называются квадратурными формула- 
ми левых и правых прямоугольников соответственно. Совер- 
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- + 

шенно очевидно (рис. 12.2), что /"` и ["* вместе дают двусто- 
ронние приближения к значению / интеграла от монотон- 
ной функции. 


а) 6) 


Рис. 12.2. Геометрическое оценивание интеграла от монотонной 
функции с помощью: а) 1 й- ‚б) / 8+ 


Можно рассчитывать на большую точность получения зна- 
чения интеграла, если взять точку &; посередине между точками 


Хх; ИХ;. Отсюда приходим к следующему случаю. 


3) Фиксируем &; = +х;) (=х;1 5 = ->. В ре- 
зультате имеем квадратурную формулу средних прямоугольни- 


ков или, иначе, формулу средней точки 
п п р п р 
Ты Т 58 жча |= [ч-2 (12.8) 
р 27 м 2 


Учитывая априорно большую точность формулы (12.8) по срав- 
нению с формулами (12.6) и (12.7) при том же объёме и характе- 
ре вычислений, эту симметричную формулу будем впредь назы- 
вать просто формулой прямоугольников. 


Полученные из определения интеграла квадратурные пра- 
вила (12.6)—(12.8) не содержат в себе сведений, позволяющих 
сказать, каким нужно взять число и элементарных промежутков 
[х р» х; | или, иначе, каким должен быть шаг Й разбиения (12.4) 
отрезка интегрирования [а, Ь], чтобы гарантированно найти зна- 
чение / интеграла с наперед заданной точностью =. Чтобы до- 
быть эти сведения, положим вывод квадратурной формулы пря- 
моугольников на другую основу, предъявив к подынтегральной 
функции Х(х) определенные требования. 


Пусть функция /(х) дважды непрерывно дифференцируема. 
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Рассмотрим сначала вычисление интеграла 
й 


п = | исх (12.9) 
й 


2 
при некотором достаточно малом Й > 0. 
По формуле Тейлора можно записать 


! 1 п 
(о) = Г (0) + (0+5 "к", 
где х — произвольная, а с — некоторая фиксированная Точки иИН- 


тервала [-^, =) Подставляя это выражение /(х) в (12.9), имеем: 


| 
5 и 
= | |704 0х5 Г*(&)х 2 ки В, (12.10) 
р 
8 
й й 
где ие НЕ | — некоторая точка, вообще говоря, несовпа- 
дающая с точкой & (поскольку значение & изменяется с измене- 


й 


2 
нием И, к /"(&) в интеграле | Я "(2х2 Ах нельзя относиться, как 
р 
Е? 
к постоянной, но, в силу неотрицательности х?, можно приме- 
нить теорему об интегральном среднем, согласно которой, если 
функция /›(х) сохраняет определенный знак на отрезке [а, Ь], 
то в интервале (а, 5) найдется точка с такая, что 


Ода = дела 


а а 
Слагаемое //(0) в выражении (12.10) интеграла Го очевид- 
но, можно расценивать как приближение к /о по формуле пря- 
моугольников в случае всего одного элементарного отрезка. 


150) 3 


(локальная погрешность) простейшей формулы прямоуголь- 
ников Го = ИХ(0). 


Второе же слагаемое, т.е. есть остаточный член 
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Ь 
Вернемся к нахождению значения / интеграла | /(х) ах 
а 


при /(х) = С?[а, В]. 
Выполним разбиение (12.4) отрезка [а, 6] на и частей с ша- 


гом ва 
Г 


отрезка [х; 1, х; |. Тогда каждый отрезок [х; 1, х;| представляется 


_а и 
и обозначим через ыы ': середину 1-го элементарного 
Е: 


й й 
своим центром симметрии в виде [| 1 > ° 1 > ‚› и, следова- 
2 2 


тельно, к каждому интегралу 


й 
Хх 1 = 
х, 5 2 

= [7го<= | Ух) ах 
1-1 _й 
хи 
= 2 


применима формула (12.10) с х, 1 в роли нуля, т.е. 
2 


И 3 
печь, 
где 1Е{1,2,й ‚И, в: Е (х; 1, х;). 


Так как по свойству аддитивности, относящемуся к проме- 
жутку о 


[Ид $ лба (12.11) 
то ыы 


Я Гб. 


4 


и-Уй вы) 


В первом слагаемом здесь узнаём выведенную ранее из 
других соображений формулу прямоугольников /” (сравните с 
(12.8)), второе же слагаемое характеризует остаточный член 
формулы прямоугольников 


т =т-г" = ул (&). 
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Согласно обобщенной теореме о среднем значении непрерывной 
функции, существует точка у Е (а, Ь) такая, что 


Ш п п 2 
ев ь = уче). 
1 = = 

В результате подстановки этого выражения в предыдущее равен- 
ство приходим к окончательному виду остаточного члена (гло- 
бальной погрешности) квадратурной формулы прямоугольни- 
ков: 


Аа, и? ‚ В е(аЬ. (12.12) 

Как видно из формулы (12.12), при увеличении числа и 
элементарных отрезков, на которые разбивается промежуток ин- 
тегрирования [а, Ь], ошибка численного интегрирования по фор- 
муле средней точки (12.8) убывает пропорционально квадрату 
шага й. Нетрудно убедиться, что погрешность численного ин- 
тегрирования непрерывно дифференцируемой функции по фор- 
мулам левых и правых прямоугольников (12.6), (12.7) убывает 
лишь по линейному закону. 


РП (в)= 


12.2. СЕМЕЙСТВО КВАДРАТУРНЫХ ФОРМУЛ 
НЬЮТОНА-_КОТЕСА 


Ь 
Подстановка в интеграл | /(х)4х вместо функции Х(х) её 


а 
интерполяционного многочлена Лагранжа той или иной степе- 


ни и приводит к семейству квадратурных формул, называемых 
формулами Ньютона-Котеса 


Как было показано в гл.8, функция Г(х)е Сен, Ь] может 
быть единственным образом представлена в виде 


Л(х)= [п (х) + А), 


Ш : 
где Г, (>) = Миа! _ — интерполяционный многочлен 
=о(х —х) Пи (х) 
ыы 9 
Лагранжа, К„(х)= И „-1(х) — остаточный член, 
п+1)! 


*) Котес Роджер (1682—1716) — английский математик. 
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п 
‚=У@)), Па) = П@-х,), Е Е(а, В). Если система узлов 
1=0 
интерполирования { х; | совпадает с точками разбиения (12.4) 
отрезка [а,Б] с шагом Й, то замена переменной х=хо +ай 
трансформирует многочлен Лагранжа к виду 


Г (хо +ай)= о 44-1) (а-п) (12.13) 
5) (#1)! 4-1 


Для того, чтобы использовать такое выражение [„(х) вме- 


Ь 
сто Г(х) в | 1(х) 4х, нужно изменить границы интегрирования 


а 
(значению х=а соответствует значение д =0, а х=Ь — значе- 


ние 4=п) и учесть, что 4х = йа4. Таким образом, получаем 


пп 


ты СО "ту; аа-0е а- т 


оо 1(и-Й! 4-1 
Это равенство, переписанное в виде 
п 
1=(Ь-а)УН;у;, (12.14) 
1=0 


и есть квадратурная формула Ньютона-—Котеса, где 


С е-0й в, 
Н.= и = (12.15) 


— коэффициенты Котеса. 


На самом деле, формулы (12.14)—(12.15) определяют се- 
мейство квадратурных формул. Параметром этого семейства 
является число и — степень интерполяционного многочлена, ко- 
торым заменяется подынтегральная функция. 

Рассмотрим несколько простейших частных случаев, соот- 
ветствующих небольшим значениям ие М. При этом конкретные 
формулы будем получать не на основе общих формул 
(12.14)—(12.15), а используя для этой цели вместо многочлена 
Лагранжа (12.13) эквивалентный ему (в силу единственности) 


первый интерполяционный многочлен Ньютона (8.26): 
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Р, (хо + 41) = уд +9Дуд О +й 


р Ви Нин (12.16) 
п! 


1) Пусть п=|, т.е. имеется всего две точки хо и 
х1 = хо +Й, в которых известны значения функции (уд = /(хо) и 
я = Л@)). Этим точкам соответствуют значения 0 и 1 перемен- 
ной а. Следовательно, 


х 1 Ра 
[Убдах = [о +аАуоваа = ны ол = 
0 


Хо 0 


ЕИоо +0 и. 12.17) 


Получена простейшая квадратурная формула трапеций, к ко- 
торой легко прийти и из геометрических соображений 
(рис. 12.3). 


Рис. 12.3. Геометрическая интерпретация простейшей формулы трапеций 


Остаточный член этой формулы найдем интегрированием 
остаточного члена К\(х) формулы линейной интерполяции, пре- 
образованного к виду 


К (хо + 91) а =. 
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Имеем: 


х 1 
п= 79-5 +1) 7-79 -а)а == 
0 0 


3 1 = 
= ве а) = ео. (12.18) 
0 


В найденном выражении остаточного члена &1 Е (хо, х1) — не- 
которая точка, отвечающая упоминавшейся в предыдущем пара- 
графе интегральной теореме о среднем, которая здесь также 
применима, в силу неположительности функции 4? — 4 на отрез- 
ке [0, 1]. 

2) Положим в (12.16) п=2, т.е. проинтерполируем функ- 
цию /(х) по трем точкам: хо, х1 = хх +Й их) =ху+2й. Тогда 


®2 Г (4-1) ‚2 
[ок = [| уд +9Дуо о —й 50 йа4 = 


Хо 0 


1 й 
= #29 +2(у1 —70)+5072 21 и] = 5% +41 + у2). (12.19) 
Полученное приближенное равенство назовем простейшей 


* 
формулой Симпсона |1 
Поставим задачу найти остаточный член 


х й 
= [оо +41 +2) (12.20) 

Хо 
простейшей формулы Симпсона (12.19). Так как функция 
а(а-1(а-2) меняет знак на промежутке [0, 2], то здесь нельзя 
воспользоваться интегральной теоремой о среднем при интегри- 


за 1-2) 


формулы квадратичной интерполяции, как это было в случае 1). 
Поэтому для выявления вида 7> изберем искусственный путь. 

Для удобства рассмотрим применение простейшей квадра- 
турной формулы Симпсона (12.19) к интегралу с симметричны- 
ми границами: 


й 
[лед = +4) + + 
в 


ровании остаточного члена А (хо +4й 


* , 
) Симпсон Томас (1710-1761) — английский математик; прошел 
путь от ткача до профессора военной академии. 
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При любом ЕЕ [0, И] ее остаточный член есть 


1 
„= еат — ДИсо+4 7) + 0. (12.21) 
ы 
Введем в рассмотрение функцию 


5 
= к9-(; „(и) (12.22) 
и изучим поведение у(Е) и нескольких ее первых производных, 
предполагая, что исходная функция Г(х) четырежды дифферен- 
цируема на [-й, #]. 


Так как 4 | Ираг=г0-СОГОВ, то 
г 
= О+лС9-3Иед+41)+70- 


и 514 
-НУ®-лСВ---—®. 
3 й 
Дальнейшее дифференцирование дает: 


и -о- и ео 


и5 


„(п), 


2 
ито. 


Последнее, благодаря формуле конечных приращений Лагранжа, 
примененной к разности третьих производных (в квадратных 
скобках), можно переписать в виде 


ВИ фи) (12.23) 


где & — некоторая точка из интервала (-1, г). 

Теперь обратимся к анализу функции у(г) и ее производных. 

Как видно из (12.21), г(0)=0; поэтому и у(0)=0. Подста- 
новка [=й в (12.22) также приводит к нулевому значению ъ({). 
Следовательно, к функции ъ() на отрезке [0, й] применима тео- 
рема Ролля, согласно которой существует точка ( Е (0, И) такая, 
что у'(п)=0 (рис. 12.4). Непосредственной подстановкой значе- 
ния 1 =0 в выражение у’(Г) убеждаемся, что у’(0) = 0. Это озна- 
чает, что теорема Ролля применима и к функции у'() на отрезке 
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[0, ], т.е. 312 (0, 4): у’(+5)=0. Так как у”(0)=0, то по 
той же теореме 3 ® Е (0, #5): ъ”(®9)=0. 


хи у 9 


0 йо ьн пою ий 


Рис. 12.4. Геометрическая интерпретация трехкратного применения 
теоремы Ролля при выводе остаточного члена простейшей 
формулы Симпсона 


Таким образом, в соответствии с (12.23), при некотором 
®9Е (0, #>) с (0, И) справедливо равенство 


-39?] / О) =0, 
й 


из которого получаем выражение остаточного члена 


В” р 
"(й) = эта (5) , ё е {-й р). 


Очевидно, эта формула может быть отнесена и к выражению то, 
определенному в (12.20), где промежуток интегрирования 
[хо, х2 | следует рассматривать как симметричный относительно 
точки х|: хЕ[х!-Й, х1 +Й]; т.е. можно записать 


5 
в =-/" ©), вебе =). (12.24) 


3) Фиксируя степень и = интерполяционного много- 
члена (12.16) равной 3, 4, 5 и т.д., придем к частным формулам 
Ньютона-—Котеса, подобным полученным выше простейшим 
формулам трапеций и Симпсона. Представим все эти частные 
случаи, включая уже рассмотренные, формулой вида 


Ж [ 
[Года = Вы а® (р) +ть (В), (12.25) 
1=0 


Хх 
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где по-прежнему считается х; =хо +, а коэффициенты В», 
а ) и остаточные члены ";(й) задаются таблицей 12.1 (точка 
ЕЕ (хо, хр), разумеется, для каждого А своя). 

Таблица 12.1 


Параметры некоторых частных форм 
Ньютона-Котеса вида (12.25) [1 я 


ЗЕЕ МЕ ЕЕ ССВ 


и 
[12 [27| | [5 945 и" @ 
275 
75 5 50 75 ри 
[|| | 12096 № 


я [| в]я ая | 


Замечание 12.1. В отличие от рассмотренных представлений 
формулы Ньютона-Котеса (12.14) или (12.25) непосредственно через зна- 
чения подынтегральной функции, имеется другой ее вид, который можно 
* 
назвать конечноразностным и который известен как формула Грегори ) 
[19, 187]: 


хо+Ай 1 
[| Фжя # (5 У0 + +Й + Ук- ея +150 - А = 
Хо 


= ДА бра м ИА И: +й 
А Уо Ук Е 550 У0 Ук- з о У0 Ук- #) 
Очевидно, эта формула имеет такие же достоинства, как и конечноразно- 
стные интерполяционные формулы (см. $ 8.12): слагаемые здесь располо- 


жены в порядке убывания значимости. При этом фиксирование А =1, 2, й 
определяет соответственно формулы трапеций, Симпсона и др. 


* ь 
) Грегори Джеймс (1638—1675) — шотландский математик и астроном. 
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12.3. СОСТАВНЫЕ КВАДРАТУРНЫЕ ФОРМУЛЫ 
ТРАПЕЦИЙ И СИМПСОНА 


Применение формул Ньютона-—Котеса высоких порядков, 
т.е. при относительно больших значениях параметра КЕМ в 
(12.25), может быть оправданным лишь при достаточно высокой 
гладкости подынтегральной функции Х(х). Более употребитель- 
ными являются квадратурные правила, получающиеся путем 
дробления промежутка интегрирования на большое число мел- 
ких частей, интегрирование на каждой из которых производится 
с помощью однотипных простейших формул невысокого поряд- 
ка. Выведем два таких правила — трапеций и Симпсона. 

1. Прежде всего, заметим, что простейшая формула тра- 
пеций (12.17) с остаточным членом (12.18) применительно к ин- 
тегрированию по отрезку [х; 1, х;| может быть записана в виде 
точного равенства 


х Пт 
2 та 
Х:-—1 
где &; — некоторая, вообще говоря, неизвестная точка интервала 
(хр х;), а у;, как и прежде, есть укороченная запись значе- 
ния /(х;). 
Выполняя разбиение (12.4) исходного промежутка интегри- 


> а 
рования [а, ] на и частей с шагом й = и применяя к каж- 


п 
дой из частей, на которые по свойству аддитивности расчленяет- 


ся | Ннтетрал формулу (12.26), Зуи иметь 


ус у ХО 1 а Ре (12.27) 


Ах, 12 = 


сюда следует, и искомое значение интеграла можно при- 
ближенно найти по формуле 


Ты 52а + +2 +Й +2 (12.28) 


которую в дальнейшем будем называть просто формулой тра- 
пеций, а погрешность приближенного равенства (12.28) можно 
охарактеризовать остаточным членом и’, полученным упроще- 
нием последнего слагаемого в (12.27). По обобщенной теореме о 
среднем значении функции на отрезке существует точка 
&, Е (а, Ь) такая, что 


>в") = Ге, ЖЬ-а) 


= 
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(площадь ступенчатой фигуры, составленной из прямоугольни- 
ков с основаниями Й и высотами /”(&;), можно отождествить с 


И 
площадью одного прямоугольника с основанием У»Уй=Ь-а 
= 
и высотой /”(2т)). Таким образом, остаточный член формулы 
трапеций (12.28) есть 


РЧиЗуч(Е,), &, «(а,5). — (1229) 


Рис. 12.5. Геометрическая интерпретация составной квадратурной 
формулы трапеций (12.28) 


2. Аналогично равенству (12.26) на основе простейшей 
формулы Симпсона (12.19) и ее остаточного члена (12.24) запи- 
шем равенство 


х р и (4) 

ее а 35. т фе ‚)-=— ;), 
ее 3 (0722 +4 Л 0 280. 
2. Е (Хр 2, Хор). 


Выполнив разбиение (12.4) так, чтобы число элементарных про- 
межутков и = 2т было четным, исходный интеграл представляем 
суммой т интегралов вида (12.30): 

ЕЁ 


>74). 


р т №: й т 
7о=У |7Г`фа==У (о +4 + ух 90 
а Е 1 


1х 3; 
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Отсюда получается формула численного интегрирования 
[= [С бо узи +491 +205), (12.31) 


ГДе О] = У + Уз +... + Узт-4» 092 := У2 +У4+...+ У2т-2, Которая 
впредь будет называться формулой Симпсона, и ее остаточ- 
ный член 


Ио) 0/9.) 4232) 


с некоторой точкой Е, из интервала (а, Ь). 


Подводя итоги этого параграфа, можно сказать, что замена 
подынтегральной функции Х(х) на промежутке интегрирования 
[а, Ь], разбитом на и частей с шагом й, кусочно-линейной уе: 


цией (рис. 12.5) приводит к его приближенному значению /” 
(12.28) с ошибкой, убывающей при Йй-—>0 (согласно (12.29)) по 
квадратичному закону. Если же сделать кусочно-квадратичную 
интерполяцию подынтегральной функции по сдвоенным элемен- 
тарным промежуткам [хо, х›|, [хо хд,й , [хот Хот|, то 
ошибка получаемого таким образом приближенного равенства 
1=1<° (12.31) в соответствии с (12.32) будет убывать пропор- 
ционально уже четвертой степени й. Это обстоятельство обусло- 
вило чрезвычайную популярность формулы Симпсона, ибо по- 
вышение порядка точности интерполяции всего на одну единицу 
повлекло повышение точности интегрирования на два порядка 
(при сохранении простоты расчетной формулы). Посмотрев на 
строку табл.12.1, соответствующую значению К=3, легко по- 
нять, что применение кусочно-кубической интерполяции на ос- 
нове формулы Ньютона-—Котеса не даст принципиального улуч- 
шения качества соответствующей формулы численного 
интегрирования по сравнению с формулой Симпсона. 


Пример 12.1. Оценим, какую точность можно гарантировать при 
вычислении интеграла 


1 2 
1 =|е* [59 


по формулам трапеций и Симпсона при разбиении промежутка интегри- 
рования на восемь частей. 
2 
Выполнив последовательное дифференцирование функции /(х)=е^, 
находим 


Мо = ах "(х] = тах 2” [о _ |) =2 


хЕ[а, хЕ[0, 1] 


М4 = пах |) = тах де 4 12? +3] = 12. 


хе[а, 6 хЕ[0, 1] 
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Ь-а 


1 
Теперь, учитывая, что р-а=1, й= = г в соответствии с формулами 


(12.29) и (12.32) получаем требуемые Оценки: 


и Мо(ь- р 1 
се 1) =— < 0.003 
12 12\8/ 384 
И 
М4 (6- ет 1 
и (3) = < 0.00002. 
180 1808) 61440 


12.4. СООТНОШЕНИЯ МЕЖДУ ФОРМУЛАМИ 
ПРЯМОУГОЛЬНИКОВ, ТРАПЕЦИЙ И СИМПСОНА 


Воспользоваться оценками квадратурных формул подобно 
тому, как это было сделано в примере 12.1, удается крайне редко. 
Поэтому вычисление интегралов с нужной точностью обычно 
производят посредством последовательного дробления шага (как 
правило, делением пополам) до выполнения некоторых критери- 
ев точности. Обоснование таких критериев и конкретные алго- 
ритмы будут приведены в следующем параграфе. Здесь же изу- 
чим связи, которые возникают между приближенными 
значениями /”, [' и /° интеграла / в процессе его вычисления 
по формулам прямоугольников, трапеций и Симпсона с шагом й 
и шагом Н =2й (рис. 12.6). 


Рис.12.6. К выводу соотношений между 1П(Н), И (Н), 11 (В) и 17 (№) 


481 


Рассмотрим сначала приближения к интегралу 
х/+Й 


Г= [УФ 


х,-й 
полученные по формуле прямоугольников с шагом Н (1/(Н)), 
по формуле трапеций с шагами Н ий =>. (И(Н) и Г; (№), а 


также по формуле Симпсона с шагом Й (17 (®)), через значения 


Ут = Ах; —й), у; = Л) и у = ЛОУ +). 
Имеем: 


И (Н)= Ну; = 21; 
И(Н) НЫ = И(Ут+ Уна); 


И(в)= те Пр Ту _ 


й 
- ОН +27; + У); 


. й 
Г; (®)= зон +4 +Ун). 


Беря полусумму правых частей первых двух из этих равенств, 
получаем правую часть третьего. Следовательно, 


1! (^) 5 (Н)+Г!(Н)). (12.33) 
Если же взять среднее взвешенное этих же равенств с весами = 
И г соответственно, то придем к четвертому равенству, т.е. 

Г: (и) = (Н)+И (Н). (12.34) 


т Ь _а 
Поскольку исходный интеграл есть /= У. 1;, где т= 7 то 


1 
индекс 7 в соотношениях (12.33), (12.34) можно отбросить. 


Итак, если й = <, то 


по (+гн)), (12.35) 


=" (Н)+Г(Н). (12.36) 
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На базе этих связей можно строить эффективные алгоритмы 
вычисления интегралов. Суть в том, что, производя для уточне- 
ния значения интеграла дробление шага Н пополам, мы должны 
вычислять новые значения подынтегральной функции в точках, 
расположенных посередине предыдущих элементарных отрез- 
ков. Эти новые значения используются для вычисления значения 


Г"(Н), все остальные значения функции передаются на этот 
этап с предыдущего уже в просуммированном виде, т.е. как 
Г (Н). Так можно получать либо более точное, чем /'(Н), зна- 
чение /" (й), либо /° (й). 
Заметим, кстати, что значение 1“(й) можно вычислить 
также по формуле 
Г (®)=Г (+ 8" (№, 0237) 


где А’(й)= (г (1) - Г! (Н)) — так называемая поправка 
Ричардсона 5" Действительно, возвращаясь к интегралу /;, не- 


посредственно (справа налево) проверяем справедливость 1-го 
фрагмента формулы (12.37): 


11 (в) + В! (в) = 1 @)+- (т (и)-(Н))= ей п (Н)= 


й | 
-- 50 +27; Уно -- И +1) =5 0-1 +4у+унл)= 


Ст. 
=/ 7 (п); 

из аддитивности интеграла теперь следует (12.37). 
Таким образом, вычисление поправки Ричардсона позволяет 
уточнить приближенное значение / ы (й) интеграла Г, получен- 


ное по формуле трапеций. Другое ее назначение будет понятно 
из материала следующего параграфа. 


12.5. ПРИНЦИП РУНГЕ ПРАКТИЧЕСКОГО 
ОЦЕНИВАНИЯ ПОГРЕШНОСТЕИ. 
АЛГОРИТМ РОМБЕРГА 


Пусть к приближенному вычислению значения / данного 
интеграла применяется некая квадратурная формула р-го поряд- 


ка точности /Р из семейства составных формул Ньютона- 
* у д < а 
) Ричардсон Льюис Фрай (1881-1953) — английский геофизик. 


483 


Котеса. При условии непрерывности р-ой производной 
подынтегральной функции это означает существование такой 
постоянной С, что 

Г=1Р (1) + СИР. (12.38) 
При уменьшении вдвое шага Й численного интегрирования по 
той же формуле р-го порядка можно записать такое же равенст- 
во, но с другой постоянной С1: 


й й`\Р 


Считая, что при малом Й постоянные С и С| близки, из (12.38) 
и (12.39) имеем 


р Р 
ТР (в) + СИР = "|: + с) = "= + (5 
2 2 5 2 
и, следовательно, 


"(5-1 
сна 


ИР — "| 
2 
Подставив это значение С] в (12.39), приходим к выражению 
р "(= № ТР() 
5—2 (12.40) 
2 2Р —1 


К приближенному равенству (12.40) можно относиться двояко. 
С одной стороны, переписав его в виде 


, (5-17) 
=, (12.41) 
2 1 


получаем возможность хотя бы грубо контролировать точность 
численного интегрирования на основе двойного счета (с шагом й 


й 
и с шагом 2). В этом и заключается широко применяемый прин- 


цип Рунге практического оценивания погрешностей. Его приме- 
нение считается правомочным [44], если выполняется неравенство 


й 
‚то 
ТР (В) -1Р (21) 


_1|<0.1. 
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С другой стороны, второе слагаемое в формуле (12.40) по- 
зволяет уточнить «дешевым» способом приближенное значение 


"(2 интеграла /. Заметим, что при р=2 формула (12.38) 
есть формула трапеций 


1=1'(®)+СА?, 
и выражение (12.41) в этом случае совпадает с определенной в 


предыдущем параграфе поправкой Ричардсона А’ С), а правая 


часть формулы (12.40) есть значение / “5, соответствующее 


формуле Симпсона. Естественно назвать обобщенной поправкой 
* 
Ричардсона получаемую с помощью двойного счета величину ) 


ТР й -1Р(й) 
от” 


Итогом рассуждений предыдущего и настоящего параграфов 
может служить, например, следующий алгоритм прямоугольни- 
ков-трапеций вычисления интеграла / с заданной точностью =. 


Шаг 1. Полагаем п :=1, Н=Ь-а, г) =5-@)+ 3). 


Н 
Шаг 2. Вычисляем т м =а+й, х=х1+Н 


(=2й, №) и= И б.п) т(н)= нуу, 


= 


Шаг 3. Вычисляем /' (п) = [и”(н)+ Е (Н)|, 


® = -г(н). 


Шаг 4. Сравниваем |" (#) сё. Если |" (#) > =, то полагаем 
п=2и, Н=й, Г(Н):=Г (0) и возвращаемся к шагу 2. 
Шаг 5. Вычисляем /[°(й) = 1' (п) + В' (№) и принимаем / := 1° (й). 


* 
) Не вызовет затруднений рассмотрение и более общего случая, 
когда шаг й заменяется на шаг | =уй, где уе (0, 1). 
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Если есть основания считать, что подынтегральная функция 
обладает достаточно высокой степенью гладкости, то для вычис- 
ления интеграла можно применить алгоритм, предложенный 
шведским математиком Ромбергом. Базируется этот алгоритм на 
связях между составными квадратурными формулами Ньютона- 
Котеса четных порядков типа установленной выше связи (12.37) 
между формулами трапеций и Симпсона через поправку Ричард- 
сона. Так, можно показать, что правая часть соответствующего 
(12.40) при р = 4 приближенного равенства 


Те ке.“ “® 


2 15 
(где / 4(®)= ГС (р), согласно предыдущему) совпадает со значе- 
й 
нием / "= которое могло бы быть подсчитано по составной 


формуле Ньютона-Котеса, отвечающей строке А =4 в табл.12.1, 
ит.д. 

Следовательно, заложив процесс деления шага пополам и 
выполнив первоначальный подсчет приближенного значения ин- 
теграла / по формуле трапеций, дальнейшие его уточнения 
можно производить рекуррентно путем прибавления обобщен- 
ных поправок Ричардсона к предыдущим приближениям к /. 

Таким образом, алгоритм Ромберга определяется следую- 
щей совокупностью формул [13]: 


а 
в (и,) = и) (и, 1), 


ар 


где Г принимает значения 1,2,3,Йй ‚а К изменяется от 1 до 7; 
счет заканчивается при выполнении условия [к (р, ) <=, по- 
сле чего полагают / := 1% (р, ). 

Последовательность уточнений значения интеграла в алго- 


ритме Ромберга удобно проследить по таблице 12.2 (см. нумера- 
цию клеток таблицы). 
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Таблица 12.2 


Схема па атниньныя ‘уточнений интеграла 
алгоритмом Ромберга 


т Я Я Я 


ПАР И О О ПО 


Вы 
а Ь 


Е 
И 


Наверное, не будет лишним обратить внимание на форми- 
рование столбца этой таблицы, соответствующего А =0. Здесь 
должны находиться значения интеграла, получаемые по формуле 
трапеций с уменьшающимся в два раза шагом. Очевидно, к это- 
му этапу целесообразно подключить часть приведенного выше 
алгоритма прямоугольников- | апеций, которая позволит эконо- 


мично вычислять значения Г 0) (р, а `(й;) на основе соотноше- 
ния (12.35). 


12.6. КВАДРАТУРНЫЕ ФОРМУЛЫ ЧЕБЫШЕВА 
И ГАУССА 


Общий вид линейной квадратурной формулы — это 
Ь 
Гоа = У АЛ), (12.42) 
а 1 


где фиксированные аргументы х; называют узлами, а коэффици- 
енты 4; — весами (весовыми коэффициентами) квадратурной 
формулы (определенный интеграл приближенно равен среднему 
взвешенному значений подынтегральной функции, вычисленных 
в определенных точках промежутка интегрирования). 

Все рассмотренные выше квадратурные формулы характер- 
ны тем, что узлы в них брались равноотстоящими с шагом й, а 
веса находились в результате подмены подынтегральной функ- 
ции Г(х) кусочно-постоянной в случае формул прямоугольников, 
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кусочно-линейной в случае формулы трапеций, кусочно- 
квадратичной в случае формулы Симпсона и т.д. Например, у со- 
ставной формулы трапеций набор весов получился следующий: 


тя а 
2 2 


ау составной формулы Симпсона — 
й ай 2й ай 2й 


К Е 


) ’ 
Далее мы откажемся от равномерного распределения узлов 
х; на промежутке интегрирования [а, 6] и будем их находить 
из тех или иных соображений. В таком случае целесообразно 
предварительно сделать линейную замену (см. $ 9.2) 


а+ь Ь-а 
Же + 
й 2 
и преобразовать исходный интеграл к интегралу со стандартным 
промежутком интегрирования [-1, 1]: 
Ь 1 
Ь- Ь Б- 
[бак =2— | ие + “а (12.43) 
ы В АЕ В 


Равенство (12.43) позволяет без ограничения общности рассмат- 
ривать теперь вычисление интеграла 


1 
= | Ф() 4, 
—1 
т.е. строить квадратурные формулы вида 


„ п 
1= У А), (12.44) 


1=1 
от которых на основе (12.43) легко перейти к квадратурным 
формулам (12.42). 

Сделаем еще два предварительных замечания. 

Во-первых, обратим внимание на разную роль параметра п 
в квадратурных формулах предыдущих параграфов и в форму- 
ле (12.44): если ранее и означало число элементарных отрезков, 
на которые разбивался промежуток интегрирования, то здесь и 
— это число узлов. 

Во-вторых, квадратурные формулы, основанные на равно- 
мерном разбиении отрезка [а, Ь] на и частей с шагом й, сравнива- 
ли по точности в зависимости от степени й, содержащейся в вы- 
ражениях их остаточных членов (см. (12.12), (12.29), (12.32) и 
табл.12.1). Но те же остаточные члены позволяют судить о точно- 
сти иначе. Поскольку в выражение остаточного члена квадратур- 
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ной формулы входит множителем производная подынтегральной 
функции определенного, например, А-го порядка, и поскольку 


К-я производная многочлена (К-—1)-й степени равна нулю, мож- 
но сказать, что соответствующая квадратурная формула точна 
для многочленов степени К-1. В таком случае К-1 есть 


алгебраический порядок точности квадратурной формулы. 


Потребуем, чтобы в формуле (12.44) значения функции 
Ф(#;) суммировались с одинаковыми весами А; = А, а узлы {(; 
получающейся при этом формулы 


1 И 
Года = АУ (и) (12.45) 
—1 1 


располагались на отрезке [-1,1] так, чтобы формула (12.45) была 
точна для многочленов степени и. Отвечающая этим условиям 
формула называется квадратурной формулой Чебышева (она 
хороша тем, что минимизирует вероятную ошибку, если значе- 
ния $(1;) имеют нормально распределенную случайную ошиб- 
ку [90]. 

Считая, что равенство (12.45) должно быть непременно точ- 
ным для постоянной функции, подставим в него (г) =1. Имеем 


1 п 2 
П4= АУЛ, откуда А=-. 
Я = п 


Следовательно, вместо (12.45) теперь можно использовать более 
конкретный шаблон квадратурной формулы Чебышева 


1 2 п 
Гоа ==>). (12.46) 
—1 1 


Чтобы выписать совокупность условий на расположение 
узлов {[; на отрезке [-1, |, можно либо подставить в левую и 
правую части равенства (12.46) функцию-многочлен 


Ф(1) = ад +а/+а21? +й +ат" 


и считать это равенство точным при любых а;, либо поочередно 
подставлять в (12.46) представителей многочленов, коими явля- 
ются степенные функции ЕР, ‚(" (функция 10 =1 уже ис- 


2 

пользована для выявления веса А=—). В любом случае 
п 

приходим к нелинейной системе 
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и 
йе = г 
Ее +8 = 0, 

И 12.47 
РЕ Фе = > И 


Доказано, что эта специфическая симметричная система и урав- 
нений с и неизвестными определяет единственный набор узлов 


р при и=1,2,3,й ,7, 9 (Чебышев) и не имеет действитель- 


* 

ных решений при и=8 и и>10 (Бернштейн )). Эти узлы под- 
считаны с высокой точностью и затабулированы (при нескольких 
первых значениях и см. их далее в табл.12.3). 


Вернувшись к более общему, чем (12.45), виду квадратур- 
ной формулы (12.44), замечаем, что эта формула имеет 2и пара- 
метров: и узлов {; ии весов А;. Если считать, что мы свободны 


В выборе как узлов, так и весов, можно попытаться подобрать их 
такими, чтобы равенство 


1 п 

[20а = У. Аф(и) (12.48) 

= = 
было точным для многочленов степени 2и -—1 или, что то же, для 
2п степенных функций 0(!) =1,& , й , 17-1. В этом случае по- 
строение квадратурной формулы наивысшего алгебраического 
порядка точности вида (12.48), называемой квадратурной фор- 
мулой Гаусса, упирается в решение нелинейной системы 


У = Эа, 


(12.49) 


* й 

) Бернштейн Сергей Натанович (1880—1968) — российский матема- 
тик, академик АН СССР, один из основателей конструктивной теории 
функций. 
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(где 7 всюду изменяется от | до и), получающейся аналогично 
системе (12.47). Решение системы (12.49) весьма затруднитель- 
но, но его несложно обойти, если знать конечный результат. 

Оказывается, узлами {; квадратурной формулы Гаусса 
(12.48) служат корни многочлена Лежандра 1, ({) (см. $ 10.4), 
которые, как известно, существуют при любом и, различны и 
принадлежат интервалу (-1,1), а веса А; находятся интегрирова- 
нием базисных многочленов Лагранжа /,(Г) степени п-1 
(см. $ 8.2), а именно: 


о е-ь) 
р | 
а @ би). б-р -ы) 
Докажем, что при таких {; и А; формула (12.48) будет точна при 
подстановке в нее вместо ф(Г) любого многочлена Р›„_1(!) сте- 
пени 2и-—1. 

Согласно теореме о делении многочлена с остатком, для 
пары многочленов Р›„_1(1) и У„(Г) однозначно найдется другая 
пара многочленов И„1(Г) и Г, 1(() таких, что 


Ри (Е) = Ил, (0. (12.51) 


В силу линейной независимости и попарной ортогональности 
и > 

(см. (10.24)) системы многочленов Лежандра {7 }} 7—0, найдется 

такой набор коэффициентов &4, о1,й ‚Я, 1, что 


Ии—1(0) = в Хо (@) + 10+... +1, УтЕ[-ЬП 


(12.50) 


[ода = [ое хай 
= |: =. 


1 
й + Чи-1 ГКО, =о У <, м1, й › Чи-1: 
—1 


Следовательно, интегрирование (12.51) приводит к равенству 
1 1 
ГР = [Ура 
— — 


являющемуся результатом преобразования левой части формулы 
(12.48) при $(() = Р„_1(). 


491 


Рассмотрим теперь правую часть формулы (12.48) с А;, оп 
ределяемыми посредством (12.50), и с (; такими, что 1, (1;)= 0. 
Имеем: 


> АР) Аи, ен ут, 3@)= 


= 


_ бр @-п)..@-и.0е-щд.@-ы) 
а =). Ев бры) 


(#-11)..(-1)@-в4).@-ы) Ш. 
_ - 1 (н.в аль -ь) ты и _ И о 


Последнее равенство в цепочке проведенных преобразований 
объясняется тем, что выражение в квадратных скобках под зна- 
ком интеграла есть интерполяционный многочлен Лагранжа 
(п-1)-й степени, составленный по и значениям ГИ, 1(1;) 
(=Ь2,й ‚п) многочлена (п-—1)-й степени И,„_1(!), т.е. этот мно- 
гочлен однозначно (в силу единственности интерполяционного 
многочлена) восстанавливается интерполированием. 
Итак, имеем точное равенство 


МР (1;) — 


1 п 
Ри (04 = У АР) 
и = 


при указанном фиксировании величин А; И 1» означающее, что 


эти величины могут служить весами и узлами квадратурной 
формулы Гаусса (12.48). 


Запишем теперь общую формулу для квадратур Чебышева 
и Гаусса применительно к исходному интегралу по промежутку 
[а, Б] на основе преобразования (12.43): 


ры Ри, (12.52) 


Ь 
Годак = 


Значения узлов {[; и весов А;, округленные до шести знаков по- 
сле запятой, при и = 2, 3, 4, 5 приведены в табл.12.3. При необхо- 
димости узнать ({;, А; с большей точностью или при и > 5 следует 
обратиться к другим источникам (например, [19, 90, 99, 104]). 
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Таблица 12.3 


Узлы и веса квадратурных формул Чебышева и Гаусса 


Формула Чебышева 
Е 
тре 0.577350 | 1 [| 0.577350 | 1 | 


+0.707107 
0 


+0.794654 +0.861136 0.347855 
+0.187592 2 +0.339981 0.652145 
0.832497 +0.906180 0.236927 
+0.374541 +0.538469 0.478629 

0 0 0.568889 


Остаточный член квадратурной формулы Гаусса (12.52), 
как следовало ожидать, выражается через (2и)-ю производную 


функции Х(х): 
(Ь —_ ау" (и)* 


(2 +1 @ У РЕ Ст Е (а, Ь); (12.53) 


й х. т 

т =1-Г = 

его вывод можно найти, например, в [19]. Там же выводятся и 

остаточные члены 7, :=1-Г” квадратур Чебышева вида (12.46) 

для всех конкретных значений и, при которых они существуют. 
[ 

Для г, , как и для остаточных членов формул Ньютона-Котеса, 


характерно «перепрыгивание» через порядок входящих в их вы- 
ражение В. 


о 5! (>), о (3), 


135 360 
ч _ Ч и 
74 59 (24), г и? (25) 
и тд., где & — некоторые фиксированные точки интервала 


(-1, 1). Сравнение этих величин с соответствующими значениями 
’„, поставляемыми формулой (12.53) при а =-1, В=1, т.е. для 
квадратурной формулы Гаусса (12.48), а именно, со значениями 
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& 2 зам | т 
=" (65), в =" (6), 


135 15750 
Г 2 и (# Г 13 х(; 
Г =—— й И: —— й 
4 = 3472875? (4), = 1237732650 ® (5) 


говорит о существенно более быстром убывании ошибки форму- 
лы Гаусса при достаточной гладкости интегрируемой функции. 


Проблема корректного использования формул Чебышева и 
Гаусса (12.52) — в трудности оценивания модулей производных 
высоких порядков (если они еще существуют!). Выход можно 
искать в построении составных формул подобно тому, как это 
делалось выше. К сожалению, здесь неприменим напрямую 
принцип Рунге, которым можно было бы руководствоваться при 
разбиении интеграла на части для получения его значения с на- 
перед заданной точностью. Полезную роль на этом пути может 


* 
сыграть изучение квадратурных формул Маркова ) [9, 19, 129]. 
Алгебраическая точность таких формул ниже, чем у соответст- 
вующих формул Гаусса, но зато какие-то узлы могут произволь- 
но фиксироваться. Например, в число узлов «насильно» могут 
быть включены одна или обе границы интегрирования; в послед- 
нем случае такая формула называется квадратурой Лобат- 


то“*) [9, 13]. 


Замечание 12.2. По тому, входят границы интегрирования в число 
узлов или нет, квадратурные формулы подразделяются на формулы замк- 
нутого и открытого типов соответственно. Очевидно, формулы Чебы- 
шева и Гаусса относятся к формулам открытого типа, а формулы Ньюто- 
на-Котеса — замкнутого. Введение квадратурных формул Маркова 
позволяет «замкнуть» формулы Гаусса. 


Замечание 12.3. Если на промежутке интегрирования [а,6] доступ- 
ны значения не только подынтегральной функции, но и некоторых ее про- 
изводных, можно отказаться от требования несовпадения узлов интегри- 
рования, и от вида квадратурной формулы (12.42) перейти к более общему 
виду формул численного интегрирования с кратными узлами [104, 133]. В 
основу построения конкретных квадратурных формул такого типа можно 
положить, например, подмену подынтегральной функции /(х) ее интер- 


* ’ 
) Марков Андрей Андреевич (1856-1922) — широко известный 
русский математик, академик Петербургской академии наук. 


**) Лобатто Рехюэл (1797-1866) — нидерландский математик. 
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поляционным многочленом Эрмита Н»„(х) (см. $ 8.8). Добавление к зна- 
чениям функции только первых производных в точках а и Б приводит к 
простейшей формуле Эйлера (Эйлера_Маклорена) [78] 


ми — „2 
ред ло а) - 76, 


на базе которой при равномерном разбиении (12.4) получается составная 
формула Эйлера 


[= 


ы 
[= [2 = Пт т 2 +й о (а)- (5). (12.54) 


Последняя незначительно усложняет составную формулу трапеций 

(12.28), но существенно повышает ее точность, о чем свидетельствует ве- 

7 & р 

личина ошибки г? =/- 1? мт (х)аХ в сравнении с величиной /” 
а 


в (12.29). Интересно отметить, что формула (12.54) может быть выведена 

из формулы Грегори (см. замечание 12.1), если запись последней оборвать 
1 

на втором слагаемом 12% — Луг), зафиксировать А=и и воспользо- 


ваться обсуждавшейся в восьмой главе связью между конечными разно- 
стями и производными: Дуд = А/'(а), Ду, = ИГ "(Б). 


12.7. ФОРМУЛЫ ГАУССА-КРИСТОФФЕЛЯ 


* 

Квадратурной формулой Гаусса-Кристоффеля ) ПТ, 78] 
(или формулой типа Гаусса [129], или просто Гаусса [13, 19, 
158]) называют формулу наивысшего алгебраического порядка 
точности вида 


Ь И 
[родах = У А.Р), (12.55) 
а 1 


где границы интегрирования а и ВБ могут быть как конечными, 
так и бесконечными, а весовая функция р(х) должна удовлетво- 
рять нескольким условиям. А именно, функция р(х) должна 
быть непрерывна и положительна на интервале (а, 5); при х=а 
и х=рф она может обращаться в нуль или в бесконечность, при 


Ь 
этом должен существовать |р(х)4х. Очевидно, на конечном 


а 
промежутке [а,Ь] всем этим требованиям удовлетворяет функ- 


“) Кристоффель Элвин Бруно (1829—1900) — немецкий математик. 
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ция р(х)=1, с которой квадратурная формула Гаусса вида 
(12.42) (или вида (12.48) при а =-1 ВБ =1) является частным слу- 
чаем формулы Гаусса-Кристоффеля (12.55). 

Обобщим знания о квадратурной формуле Гаусса, получен- 
ные в предыдущем параграфе, на формулу (12.55). При этом, ес- 
тественно, будем пользоваться более широким понятием ортого- 
нальности с весом, согласно которому множество многочленов 
{ Ои(х), Ох), й , О,(х),й } образует систему ортогональных с 
весовой функцией р(х) многочленов на (а, 5), если 

ь 
О дак = рр ках 4250 
а 


с0п5{ =0 при К = /. 
Как уже упоминалось в $ 10.4, многочлен и-й степени О„(х) из 
такой системы имеет на промежутке ортогональности (а, 5) ров- 


но и вещественных корней (независимо от того, конечен этот 
промежуток или бесконечен). Они и принимаются за узлы квад- 
ратурной формулы Гаусса-Кристоффеля. 


Теорема 12.1. Квадратурная формула (12.55) точна 
для произвольного многочлена степени 2п —1, если ее узлами 
х; служат корни многочлена О„(х) из семейства многочле- 
нов, ортогональных на промежутке интегрирования (а, Ь) 
с весом р(х), а весовыми коэффициентами — числа 


Ь 
ь | м п (>; —Х1 (х; р | )й (х; -х„) 


Доказательство проведем схематично, поскольку оно 
повторяет рассуждения, которые были положены в обоснование 
аналогичного результата для формулы Гаусса (12.48). 

Возьмем произвольный многочлен степени 2и-1 и пред- 
ставим его в виде 


Ри (х) = И „1 (х)О,(х) +71 (х) (12.58) 


(сравните с (12.51)). Разложим И„_1(х) по базису О%з(х), О! (х),й 
й , О, (х) с коэффициентами @0,@1,й ‚ @„_1 и подставим 
Р›„_1(х) в качестве /(х) в левую часть формулы (12.55). Тогда, 


р(хаХ. (12.57) 
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в силу (12.56), будем иметь 


Иры де во до (ак 
р р 
И и 


ы бои (хх = роди (х)ах. 


а а 
Подстановка в правую часть (12.55) функции Х(х)= Р›„_1(х) в 
виде (12.58) дает тот же результат: 


И И И 
>. АР ил (х,)= У Ах), (х;) + АТ (х,) = 0+ 
1 ы "Е 


ая м 


аб -хдй © -х 1), хи и -ж) Фрая ооо В 


а 


Ь 
= | руда, 
а 
так как по условию О, (х;) = 0, а 
в (м). ыы) 
+ -м)..- хи) - ха). - жи) 
согласно теории интерполирования. 
Как видим, для алгебраической функции Р›„_1(х) равенство 
(12.55) является точным. Теорема доказана. 


Ри-1 (х; ) = Р-1 (х), 


Условия на узлы х; и веса А; фигурируют в теореме 12.1 в 
качестве достаточных условий для того, чтобы формула (12.55) 
являлась квадратурной формулой наивысшего алгебраического 
порядка точности. Доказано [99 и др.], что они являются и необ- 
ходимыми. 


Замечание 12.4. При любом расположении узлов х; на [а,Ь] фор- 
мулу вида (12.55) называют интерполяционной квадратурной формулой 
[129] или квадратурной формулой интерполяционного типа [9, 158], 
если ее весовые коэффициенты задаются равенством (12.57). Таковыми 
являются не только рассматриваемые здесь формулы Гаусса- 
Кристоффеля, но и изученные ранее простейшие формулы прямоугольни- 
ков, трапеций, Симпсона, а также формулы Чебышева. Интерполяцион- 
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ными квадратурами не будут формулы численного интегрирования, опи- 
рающиеся, например, на аппроксимацию подынтегральной функции мно- 
гочленами наилучших среднеквадратических приближений (см. гл. 10), а 
не на интерполяцию. 


Несколько конкретных квадратурных формул Гаусса- 
Кристоффеля можно получить на базе приведенных в $ 10.4 
классических ортогональных многочленов. 

1 


=1, р(х) === 

\1-х2 
взяв в качестве узлов х;, корни многочлена Чебышева Т, (х) 
(см. (2.3)), придем к формуле 


Положив в формуле (12.55) а=-1, В и 


[2 в > АГ, (12.59) 


которую называют квадратурной формулой Эрмита [19, 


169] ). Формула (12.59) имеет алгебраический порядок точности 
2п-1, когда ее коэффициенты А;, согласно теореме 12.1, вы- 
числяются по формуле 12.57. Учитывая краткую запись интерпо- 
ляционного многочлена Лагранжа в виде (8.6а), формулу для вы- 
числения весовых коэффициентов в данном случае можно 
представить так: 


п ® И. __ 
5@- ЖД '(х;). М1 х2 
Знание вида и свойств многочлена Чебышева позволяет найти 
значения интеграла в выражении (12.60) при 1=12,й ‚и и уста- 
новить, что все коэффициенты в формуле (12.59) равны между 
собой [19, 99, 129]: 


А.=^ М1ей,2,В ‚п}. 
и 


д. (12.60) 


ти 


Таким образом, квадратурная формула Эрмита есть 


ня г 5), (12.61) 


” В [90] так называется другая формула, см. далее (12.64). 
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где х; =с0$ л — корни многочлена Т, (х). Известна она и 


как формула Мелера [111, 129]. 


Промежуточное положение между общей формулой Гаус- 
са-Кристоффеля (12.55) и ее частными представителями, како- 
выми являются формула Гаусса и формула Эрмита, занимает 
квадратурная формула вида 


[а +) усдах я $ Аи) (@в>-1). (12.62) 

—1 = 
На самом деле (12.62) — это двупараметрическое семейство 
квадратурных формул, имеющих наивысший алгебраический 
порядок точности, когда за узлы х; принимаются корни ортого- 
нальных с фигурирующей под знаком интеграла весовой функ- 
цией многочленов Якоби (упоминавшихся в $ 10.4), а коэффици- 
енты 2; вычисляются в соответствии с формулой (12.57). При 
некоторых конкретных значениях параметров х и р узлы х; и 
веса А; можно найти затабулированными в справочной литера- 
туре (например, [104], где вместо |[-1,1] за основу принят про- 
межуток [0, 1]; там же содержатся числовые данные и для других 
формул численного интегрирования). 

В случае произвольного замкнутого промежутка интег- 
рирования [а, 5] для того, чтобы воспользоваться квадратурными 
формулами типа формулы (12.62), достаточно свести его, как это 
делалось ранее в $ 12.6, к стандартному промежутку [-1, 1]. 

Если одна или обе границы интегрирования бесконечны, 
тогда на основе ортогональных многочленов Лагерра и Эрмита 
приходим соответственно к формулам 


Тех годах = $ А.Г (а) (12.63) 
0 Ы 
И 
Ге годик = У Абу, (12.64) 
—о Е 
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которые иногда называют также соответственно квадратурными 
формулами Лагерра и Эрмита [90]. За узлы в них принима- 
ются корни многочленов Лагерра /,(х) в (12.63) и Эрмита Н,„(х) 
в (12.64) (см. $ 10.4), а весовые коэффициенты 2; подсчитыва- 
ются по формулам [99]: 


5 2 
д“ ® = -| р, 


Гоо@-х С) _ х Г! (х; УР ии) 


для квадратуры (12.63) и 
. у. ных)? ит 27 Ци-1 Ух 
«(х- х)Ни(м) [НР "Ни 


для (12.64) (точки х; в этих формулах предполагаются уже фик- 


сированными указанным образом) *). 

Числовые данные об узлах и весах квадратур Лагерра и Эр- 
мита для значений и от 2 до 5 представлены в таблице 12.4 [90, 
104]. 

Остаточные члены формул (12.63) и (12.64) имеют соответ- 
ственно вид [99, 104] 


п 0 Е) и кЭ- МИ би) 
п К и” 


где бл Е (0,+ со), Е) Е (- со, + со). 


# 

) Называют их также квадратурными формулами с весом Чебы- 
шева-Лагерра и Чебышева-Эрмита соответственно [89]. Имеется и бо- 
лее общая формула Чебышева-Лагерра [104] 


© Ш 

[хбе * /(хук =>. А,У(х;), 
0 = 
поглощающая (12.63) при &=0. 


ыы. Чтобы в представленных здесь интегральных выражениях А; уз- 
нать обоснованную в теореме 12.1 общую формулу (12.57), достаточно 
вспомнить краткую запись интерполяционного многочлена Лагранжа в 
виде (8.6а). Использование многочлена Лагерра /„(х) в первом и Эрми- 
та Н„(х) во втором интегральных выражениях подчеркивает, что за уз- 
лы х|,й , х,„ принимаются корни именно этих многочленов. 


500 


Таблица 12.4 


Узлы и веса квадратурных формул Лагерра (12.63) и Эрмита (12.64) 


Формула Лагерра 


Формула Эрмита 


Хх: 
0.585786 
3.414214 
0.415775 
2.294280 
6.289945 
0.322548 


1.745761 


О о 


4.536620 
9.395071 
0.263560 


=| 


[5% 


1.413403 


> 


3.596426 


> 


7.085810 
12.640801 


А, 
0.853553 
0.146447 
0.711093 
0.278518 
0.0103893 
0.603154 
0.357419 
0.038887 
0.000539295 
0.521756 
0.398667 
0.0759424 
0.00361176 


0.00002337 


ый 
—0.707107 
0.707107 
—1.224745 
0 
1.224745 
—1.650680 
—0.524648 


0.524648 


Я Е 


1.650680 
—2.020183 
—0.958572 

0 


0.958572 
2.020183 


А, 


0.886227 


0.0199532 


12.8. ПРИЕМЫ ПРИБЛИЖЕННОГО ВЫЧИСЛЕНИЯ 


НЕСОБСТВЕННЫХ ИНТЕГРАЛОВ 


В этом параграфе рассмотрим вычисление интегралов вида 


А) [/бак, 
0 


Б) ТВ (х) 


—с 


* 
) Более общий случай интегрирования на промежутке [а, +00) сво- 


дится к случаю А) или линейной заменой переменной, или представлени- 


00 


со 


ем интеграла | в виде двух интегралов: | и | ‚› один из которых — 


а 
определенный. 
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0 


ь 
в) [/(х)ах 


при наличии бесконечных разрывов у функции Г(х) в последнем 
интеграле либо в точке х=а, либо в точке х=Б, либо, в общем 
случае, в некоторой точке х=са [а, Ь]. Вычисляемые несобст- 
венные интегралы, разумеется, предполагаются сходящимися. 

Одним из источников получения численных значений не- 
собственных интегралов А-В являются рассмотренные в преды- 
дущем параграфе квадратурные формулы из класса формул Га- 
усса-Кристоффеля. Для их применения нужно выделить под 
интегралом подходящую весовую функцию и воспользоваться 
соответствующей квадратурой. 

Так, в случае А можно записать 


бдеть >‘ А 1х), (12.65) 
0 0 1 


т.е. применить квадратурную формулу Лагерра (12.63). 
Аналогично, для интеграла Б имеем 


[дак = Ге е” дя У дей (у, 
о в = 


где А; и х; должны соответствовать формуле Эрмита (12.64). 


[2 
Пример 12.2. Точное значение несобственного интеграла | ШИ 
0 
п? 
равно а =-2.4674 [59]. 


Применение к этому интегралу формулы (12.65), т.е. приближенно- 
го равенства 


со х п 
Пим = У. А,ф(х,), 
о 


1-е* 


х 


где 9(х):=е” Ш ьЕ- [в |/=- ‚с А их, из табл.12.4, дает: 


6-38 
при и=2 
А ф(х!)+ А>ф(хо ) = 0.8536: (-2.2562)+ 0.1464. (- 2.0007) = -2.219; 
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при и = 4 


4 
У А.ф(х,) = —(0.6032.2.5311+ 0.3574 -2.0207 +0.03889-2.0001 + 

=1 

+0.0005393.2.0004) = 2.328. 


В промежуточных вычислениях здесь обращает на себя 
внимание незначительное изменение от узла к узлу абсолютных 
значений функции ф(х); быстрое убывание модуля подынте- 


гральной функции /(х) принимает на себя весовая функция е *, 


что находит отражение в убывании весовых коэффициентов 4; с 
ростом Г. Как отмечается в [104], убывание или ограниченность 
модуля функции е^ Г(х) в (12.65) (ф(х) в данном примере) чре- 
ваты медленной сходимостью квадратурного процесса Лагерра, 
так как эта функция должна аппроксимироваться многочленами, 
а у них модули растут при х —> ®. Отсюда — целесообразность 
введения множителя х“ (см. сноску на с. 500), который за счет 
подбора параметра & позволит регулировать поведение интегри- 
руемой с весом хе ^ функции. 


1 
Так, в данном примере при п=4, а = > т.е. с весом Чебышева- 


Лагерра е-*/Мх, нужно просуммировать значения функции 


Ух 1-е* 

п 
е* 1+е 
в узлах х| = 0.145304, х› =1.339097, хз =3.926964 и х4 = 8.588636 с ве- 
совыми коэффициентами А, =1.322294, А› = 0.415605, Аз = 0.0341560 и 
Ад = 0.000399208 соответственно [104]. Вычислив значения 
(ху) = —1.1566, у(х›)=-1.7696, ц(хз)=-3.9638, ц(х4)=-5.8581 
(возрастающие по модулю!), получаем приближение к данному интегра- 
лу = -2.403, более точное, чем найденное выше при том же числе узлов 
п=4 и параметре а =0. 


и(х):=Ухе” т в5 = 


х 


К вычислению интегралов с бесконечной границей можно 
применять различные формулы численного интегрирования, 
пользуясь равенством, определяющим несобственный интеграл: 


© ь 
[7<ах = Ат ГУ) ах | 


Оно позволяет считать, что для достаточно больших значений ВБ 


со р 
[7одах = [ Уодах, (12.66) 
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Ь 
и вычислять определенный интеграл [гб с помощью из- 


а 
вестных квадратурных правил. Предполагая исходный интеграл 
абсолютно сходящимся, величину абсолютной погрешности, т.е. 


[е.9) 
| 7(С)ах, за счет увеличения Ь можно сделать сколь угодно ма- 


Ь 
лой. Реально это может быть достигнуто либо с помощью анали- 


тического оценивания этой величины, либо таким устройством 
алгоритма вычисления данного несобственного интеграла на ос- 
нове приближенного равенства (12.66), при котором граница В 
вычисляемого определенного интеграла постепенно перемеща- 
лась бы в процессе счета вправо по оси абсцисс до тех пор, пока 
величина интеграла не перестанет изменяться в требуемых деся- 
тичных знаках. 


В случае несобственных интегралов типа В без ограничения 
общности можно считать, что подынтегральная функция имеет 
особенность на границе промежутка интегрирования, т.е. если 
точкой с, где Г(х) обращается в бесконечность, окажется внут- 


ренняя точка интервала (а, Ь), то данный интеграл можно пред- 


с Ь 
ставить символически как | + | . Также без потери общности, 
а [2 


1 
как мы уже знаем, достаточно рассматривать | 1х) ах. Но к та- 
= 
ким интегралам, в которых подынтегральная функция имеет осо- 
быми точками —1 и (или) 1, можно применить квадратурную 
формулу Эрмита (Мелера) (12.61) в виде 


КИ ЕО >. 
хае= х;) 12.67 


или более общую формулу (12.62), где параметры 
а&>-1) > -1 желательно подобрать так, чтобы функция 


Ф(х) = (1-х) (1+х)Р 1%) 


была как можно более гладкой. Такой прием при вычислении не- 
собственных интегралов называют мультипликативным выде- 
лением особенностей [19, 71, 78]. Существует несколько специ- 
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альных квадратурных формул, позволяющих «загнать» в весовые 
функции различные типы особенностей: степенную, логарифми- 
ческую и др. [104]. 

Другой прием работы с интегралами типа В, предложенный 
Л.В.Канторовичем, называется аддитивным выделением о0со- 
бенностей. Здесь, вообще говоря, нет необходимости заранее 
сводить интегрирование к стандартному промежутку. Суть 
приема состоит в том, что данный несобственный интеграл пред- 
ставляется в следующем виде: 


Ь Ь Ь 
Гоа = [оба + [У<)- Фо ах, (12.68) 


где функция ф(х) подбирается так, чтобы она имела на [а, 6] та- 
Ь 
кую же особенность, как и Г(х), и значение |ф(х)4х находилось 


а 
аналитическим путем, а функция /(х)-‹Ф(х) должна быть глад- 
Ь 
кой, т.е. интеграл |[/(х)-Ф(х)]Ах без проблем должен вычис- 


а 
ляться обычными квадратурами. 

Для функций определенного класса со степенными особен- 
ностями разработана технология подбора таких функций ф(х), 
которые принимают на себя особенность не только функ- 
ции /(х), но и некоторого числа ее производных, что позволяет 
ко второму интегралу в (12.68) применить квадратурные форму- 
лы заданного порядка [19, 61, 71]. Покажем, как это можно сде- 
лать. 

Пусть се [а, 5] — особая точка функции /(х) такой, что 


Е 


(с) 


где уЕ (0, 1), а 2(х)е СВ, Ь], и пусть для вычисления второго 
интеграла в (12.68) предполагается использовать квадратурную 
формулу, требующую от функции Х(х)- Ф(х) непрерывность К - 
ой производной. Введем в рассмотрение функцию 


ыы _ ) 


в т в бб ее". 


841(х):= 8(с)+ 8'(с)(х -с)+... 
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Так как эта функция есть отрезок разложения Тейлора функции 
2(х) в окрестности особой точки х=с, то, полагая 


а (х) 
у 


1) т Ф(х) = = — ЕН (х) .=. ох г с)* | | 


х-с)’ 


Ф(х) = ‚ будем иметь равенство 


(х-с 


означающее непрерывную  дифференцируемость функции 
10) - Ф(х) не менее К раз. 
Имеются обобщения рассмотренного преобразования по- 


дынтегральной функции, например, учитывающие особенности 
логарифмического типа [19 


1 
Пример 12.3. Дан интеграл 1=[“— 
ох 


р 1 
функция /(х)= == имеет степенную особенность (, = 5 в точке х=0 
х 


@&. Его подынтегральная 


и удовлетворяет требуемым выше условиям. Используя известное разло- 
жение 


2 


1 1 
Е И 
2! 3! 


хх 
положим ©3(х):=1+х к" Тогда 
1 3 5 
И ОИ 
х) = Е В” Я 50°, 
#(х) === ое №5 
х2 
а 
ны ЗЕ И > 
1) -г@)= хх" + ем . (2.69) 


5! 


Согласно (12.68), непосредственно находим значение 
р =. 5 1 3 
Г я Гобда = [хат чсх У +тх и Е 
0 0 


-232 (.. 2.914286), 
35 
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1 
а к интегралу /> = [[/(х)- Ф(х)]Ах с полным основанием можно приме- 
0 
нить, например, эффективный алгоритм прямоугольников-трапеций (см. 
$ 12.5), поскольку функция Г(х)-Ф(х) имеет, по меньшей мере, непре- 


рывную вторую производную. При этом из последнего представления 
этой функции в (12.69) легко видеть, что /(0)-0(0) = 0. Подсчет значе- 


НИЯ По) - Фок указанным алгоритмом с заданной точностью 
0 


==10-© дает [› = 0.011018 (за 65 вычислений подынтегральной функ- 
ции), что приводит к значению / = Л + [> = 2.925304. 

Часто требуемый эффект аддитивного выделения особенно- 
сти достигается интегрированием «по частям». 

Так, в данном примере такой прием оказывается более простым: 


т еха\х з 
—Ж=2е х=2\хе 
ох 0 0 


1 
-2[Ухех & =2е-213, 
0 


1 
где /з = | Ухех ф — определенный интеграл с «хорошей» подынтеграль- 


0 
ной функцией. Применение того же алгоритма численного интегрирова- 


ния с той же заданной точностью приводит к значению /з =1.255630 (за 
2049 вычислений функции). В итоге получаем то же приближенное значе- 
ние / =2е-2[; = 2.925304. 

Мультипликативным выделением особенности в этом примере мож- 
но воспользоваться напрямую, если применить специальную квадратур- 
ную формулу вида 


|" 5(х)%= Уд, 2(х;) (12.70) 
1=1 
при < = -0.5 [104]: 


ы А,е”. 
Г Га 
Например, при п=4 с Вы ны узлов и весов формулы (12.70) 
из [104] находим 


1 = 0.725368-е0.033648 +. 0.627413 .е0-276184 + 0.444762 -е0.634677 + 
+0.202457-е0.922157 „2.925302, 
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а при и=6 имеем 
1= 0.498294-е0.015683 + (.466985.е0.135300 +. 0.406335 .е0.34494? + 


+ 0.320157 -е0-592750 + (0.213879. е0.817428 + ().0943507. е0-963461 „2.925304. 
Налицо эффективность использования специальной квадратуры. 


Применяются и иные приемы вычисления несобственных 
интегралов [13, 19, 78, 104, 149 и др.]. Заметим, что иногда дос- 
таточно сделать удачную замену переменной, чтобы преобразо- 
вать несобственный интеграл к более подходящему для вычис- 
ления виду. 


УПРАЖНЕНИЯ 


12.1. Выведите формулы остаточных членов для квадратурных 
формул левых и правых прямоугольников. 


12.2. Сколько требуется знать значений подынтегральной функции 


2 шх 2 
для подсчета интеграла |-—% по формуле трапеций с точностью 
х 
| 
= = 0.012 


12.3. А) Докажите, что если стоящая под знаком интеграла 
Ь 
1 = | У) функция Г(х) имеет знакопостоянную на (а,6) вторую про- 
а 
изводную, то справедлива оценка 


—=аы =], 
2 2 


где Ли — приближения к /, получаемые по формулам прямоуголь- 
ников (12.8) и трапеций (12.28). 


Каков содержательный смысл доказанного неравенства? 


я, 
3 


Б) Можно ли утверждать, что значение интеграла | п с0$х  за- 


ключено между его приближенными значениями / а: 
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12.4. Найдите значения коэффициентов квадратурной формулы 
р 
[ок = АГ(- №) В/(0) + СГ(®), 
—й 


считая ее точной для многочленов второй степени; убедитесь, что она сов- 
падает с формулой Симпсона. 


1 
12.5. Определите, с какой точностью можно вычислить | зи (е" к, 
0 
привлекая девять значений подынтегральной функции: 
а) по формуле прямоугольников; 
6) по формуле трапеций; 
в) по формуле Симпсона. 


12.6. Покажите, что содержащаяся в выражении (12.8) при п=1 
простейшая формула средней точки является частным случаем квадратур- 
ной формулы Гаусса. 


12.7. Непосредственным рассмотрением систем (12.47) и (12.49) 
убедитесь в совпадении формул Чебышева и Гаусса при и=2 и найдите 
точные значения узлов (|, 12. 


12.8. Рассмотрите разные частные случаи формулы Гаусса- 
Кристоффеля при и =1 (квадратуры с одним узлом). 


12.9. Подсчитайте коэффициенты квадратурной формулы Эрмита 
(12.59) для случая двух узлов непосредственно по формуле (12.60) (иначе, 
обоснуйте квадратурную формулу (12.61) при п=2). 


12.10. Постройте простейшую квадратурную формулу неинтерпо- 
ляционного типа, заменяя подынтегральную функцию линейной функцией 
наилучшего среднеквадратического приближения, определяемой по трем 
равноотстоящим узлам (см. функцию 0;(х) при построении линейного 
фильтра в $ 11.1). На основе полученной простейшей формулы запишите 
составную формулу такого типа. 
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ГЛАВА 13||АППРОКСИМАЦИЯ ПРОИЗВОДНЫХ 


Посредством дифференцирования интерполяционных фор- 
мул выводятся формулы для приближенного вычисления произ- 
водных. Остаточные члены полученных приближенных формул 
находятся с помощью формулы Тейлора и дифференцированием 
соответствующих остаточных членов интерполяционных фор- 
мул. Особая роль придается простейшим апироксимациям пер- 
вого и второго порядков точности первой и второй производ- 
ных в узлах сетки, что существенно используется в последую- 
щих главах. Обращается внимание на существование таких 
шагов аппроксимации производных по формулам различных по- 
рядков точности, при которых ограниченная точность вычис- 
ленных значений функции наименьшим образом влияет на точ- 
ность результата. 


13.1. ВЫВОД ФОРМУЛ ЧИСЛЕННОГО 
ДИФФЕРЕНЦИРОВАНИЯ 


Численное дифференцирование, т.е. нахождение значений 
производных заданной функции у = /(х) в заданных точках х, в 
отличие от рассмотренного в предыдущей главе численного ин- 
тегрирования, можно считать не столь актуальной задачей в свя- 
зи с отсутствием принципиальных трудностей с аналитическим 
нахождением производных. Однако имеется ряд моментов, не 
позволяющих обходить эту задачу стороной. Это и типичное для 
прикладных задач незнание аналитического вида Г(х), и воз- 
можное сильное усложнение функции при ее аналитическом 
дифференцировании (что затрудняет нахождение ее значений с 
высокой точностью), и желательность получения значений про- 
изводных с помощью однотипных вычислительных процессов 
без привлечения аналитических выкладок. Главным же для даль- 
нейшего является потребность в простых формулах, с помощью 
которых производные в заданных точках можно аппроксимиро- 
вать несколькими значениями функции (быть может неизвест- 
ной) в этих и близких к ним точках. 

Источником формул численного дифференцирования, как и 
большинства квадратурных формул, является полиномиальная 
интерполяция. 

Зная в точках х;=ху + (1=0,1Й ‚п) при некотором 
й>0 значения у; = /(х;) данной функции у= /(х), можно 


найти конечные разности м у; и записать для нее, например, пер- 
вый интерполяционный многочлен Ньютона Р,(х) (см. (8.25)). 
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Дифференцируя приближенное равенство Х(х)= Р,(х), будем 
строить формулы приближенного дифференцирования разной 
точности в зависимости от степени и используемого интерполя- 
ционного многочлена. Через вспомогательную переменную 


Х-х0 


4:= приближенное представление функции Г(х) по первой 


формуле Ньютона выглядит наиболее просто: 
аа-| 2 
ГС) = Р‚(хо + ай) = уд +4Ауд т, Ус + 
р 4(а м, ва а(а - 7 м (13.1) 
: И! 


(см. (8.26)). Отсюда получаем конечноразностную формулу 
численного дифференцирования 


, , Ей Я >Я 
(>) =а [Ри (хо +ай)]а =-—| уо +аАуд + Ауд + 
Г. 
8 4 3 2 ' 
Зы? + —6” +1107 —6 
, 4 +4 гм Чань) 
Ч 


. 


. 
1 52-12 34-642 
по-[а* г о Е В 


З 2 
493 —1 59а: 
. 44 84° +224 6 4 


+Й |. 132 
те Уо (13.2) 


При использовании последнего равенства для приближен- 
ного вычисления производной функции /(х) в заданной точке Х 


из некоторой окрестности точки хо следует найти соответст- 


вующее значение 4 переменной 4 = и подставить его в 


формулу (13.2). Максимальный порядок конечных разностей в 
этой формуле при желании получить производную с наибольшей 
точностью определяется в конкретной ситуации в соответствии с 
приведенными в $$ 8.4, 8.6 соображениями о выборе подходя- 
щей степени интерполяционного многочлена. 

Аналогично можно вывести ряд других формул численного 
дифференцирования на основе различных интерполяционных 
формул (см. гл.8), более эффективно «работающих» вблизи дру- 
гих узловых точек и в общем случае не обязательно равноот- 
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стоящих. Предоставим читателю сделать это самостоятельно 
П9идр.] и вернемся к приближенной формуле (13.2). Рассмот- 
рим несколько ее частных случаев, фиксируя степень и лежащего 
в ее основе интерполяционного многочлена (13.1), равной 1, 2, 3. 
Этим значениям и отвечают соответственно одно, два, три пер- 
вых слагаемых в формуле (13.2). Таким образом, имеем: 


на основе в интерполяции 
Год =7® для хе(х-д,х +9), (13.3) 
на основе квадратичной интерполяции 
Г’) = + + г № | для хе(хо-д, хд +9), (13.4) 


на основе Не интерполяции 


24 34? —69+2 
пон 5 12 Ус + ее, 


(13.5) 
для хеЕ(х-д,хз+0), 

и т.д. (при некоторых д > 0, определяющих промежуток экстра- 

поляции приемлемого качества соответствующей интерполяци- 

онной формулой). 

Для дальнейшего особый интерес представляют частные 
случаи формул (13.3)-(13.5), связывающие приближенное значе- 
ние производной функции /(х) в узлах хо, х,й с узловыми 
значениями самой функции. Учитывая, что точкам хо, х1, хо, Хз 
соответствуют значения 4 = 0,1, 2,3, и раскрывая конечные раз- 
ности через значения у; (1= 0,1, 2,3), имеем: 


при и =1 из (13.3) 


1х0) = уд = т (13.6) 
Гм) = и = и, (13.7) 
при и=2 из (13.4) 

7! 7! 1 

Л(хо)= Уд 253 +471 - 2), (13.8) 
! ! 1 

м) => 25.02 -20), (13.9) 
р : 1 

Хх) = у 5-4 +32); (13.10) 


при и=3 из (13.5) 
7! Й 1 
ра (хо) = У0 = СИ +181 —9у> +23), 
! 7! 1 
@)=я р 20 —Зу1 + 62 — 3), 
! [4 1 
(2) = у АЖ —бу +3у2 +253), 


в Е: 
Л’(хз) = Уз Г +9; —18у2 +1153). 


В случае необходимости этот ряд формул можно продол- 
жить с помощью общей формулы (13.2) или посмотреть в других 
источниках [19 и др.]. 


Повторное дифференцирование приближенного равенства 
(13.1), т.е. взятие производной по х от правой части формулы 


аа 1 
(13.2) с учетом — = приводит к конечноразностной формуле 
х 


вычисления второй производной 
" г | 3 Ре. 4 
ра 6-54 50 +(а-1А”Уб +69 189+ ИА У +Й |, (13.11) 


из которой таким же образом следует приближенная формула 
для третьей производной 


оао 
"(х) = —| А’уд+|а-= Ауд -+й |, 
Л") З] а Юж 
ит.д. 
Наиболее важной в приложениях является простейшая ап- 
2 
А`Уо 
р, 
на промежутке (ху —д, х› +5), получающаяся из (13.11) фик- 


сированием только одного слагаемого (случай п=2). В частно- 
сти, в точке х| имеем приближенное равенство 


проксимация второй производной с помощью постоянной 


п" п" —2У + 
т (13.12) 
которое вместе с формулами (13.6)—(13.10) широко используется при 
построении конечноразностных методов решения краевых задач для 
обыкновенных дифференциальных уравнений второго порядка (см. 
гл. 17) и для уравнений в частных производных (гл. 19—21). 
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13.2. ОСТАТОЧНЫЕ ЧЛЕНЫ ПРОСТЕЙШИХ 
ФОРМУЛ ЧИСЛЕННОГО ДИФФЕРЕНЦИРОВАНИЯ 


Чтобы получить представление о точности простейших ап- 
проксимаций значений производных в узловых точках, опреде- 
ляемых формулами (13.6)-—(13.10), (13.12), будем предполагать, 
что данная функция /(х) обладает достаточной для выведения 
остаточных членов гладкостью. Кроме того, проведем в указан- 
ных формулах смещение индексов, т.е. будем считать, что ис- 
ходная информация о функции соответствует изображенной на 
рис. 13.1, и речь идет об аппроксимации производных в 7-м узле 
х; и/или в отстоящих от него на расстоянии Й узлах х; | и х;41. 


х-1 р * й + 
Рис. 13.1. К простейшей аппроксимации производных 


Знание структуры приближенных выражений для произ- 
водных, полученных из интерполяционных соображений, позво- 
ляет без особого труда (по крайней мере, для симметричных ап- 
проксимаций) вывести формулы их остаточных членов, манипу- 
лируя разложениями Г(х) по формуле Тейлора подходящих 
порядков. Покажем это. 


Простейшая несимметричная аппроксимация /’(х;) 
(формулы первого порядка точности). Запишем представление 
функции /(х) по формуле Тейлора в окрестности точки х;: 


Ид = ед еде кд ых 
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Выразив отсюда /“(х;), имеем 


В 


х-х; 
Первый член правой части этого равенства — разностное отно- 
шение, аппроксимирующее производную вблизи х;, а второй — 
остаточный член, характеризующий точность такой аппроксима- 
ции. При фиксировании в (13.13) х=х;_| одновременно зафик- 
сируется и неизвестная точка & =; 1 Е (х;_1, х;); таким образом, 
приходим к формуле левой аппроксимации Г’(х;) с остаточным 


членом: 
; я, Л") 
0. ЕЙ, 
986) + о 


Аналогично при х=х;-1 из (13.13) получаем формулу правой ап- 
проксимации }’(х;) с остаточным членом: 


(13.13) 


(13.14) 


= и бы, (13.15) 
В приближенных равенствах 
бт (13.16) 
при 1=0 и 
Г<)== ыы (13.17) 
при /=1| узнаём выведенные ранее формулы (13.6), (13.7), а 


остаточные члены в (13.14), (13.15) указывают на то, что, поль- 
зуясь аппроксимациями (13.16), (13.17), мы совершаем ошибку 
О(И), т.е. эти формулы имеют первый порядок точности. Опре- 
деленную информацию об ошибках левой и правой аппроксима- 
ций первого порядка дает знание знаков остаточных членов. 


Простейшая симметричная аппроксимация /Г’(х;) 
(формула второго порядка точности). Из разложения 


д = ба) + По-моему +5 


при х=х; 1 и х=х; 1 имеем соответственно 


бан) = Ленд Го ед? +в? 


бк) = Ле) Хе" +7 )и? 5 )из. 


Выполнив почленное вычитание двух последних равенств, 
получаем 


3 
ера о) 


откуда с помощью теоремы о среднем, примененной к сумме 
третьих производных в квадратных скобках, приходим к форму- 
ле симметричной аппроксимации Г’(х;) с остаточным членом: 


У 2 
р ье) (13.18) 


где &; — некоторая точка интервала (х;_1, х;+1). 
«Основная» часть формулы (13.18) — 


Пт (13.19) 
— при 7=1 совпадает с (13.9), а вид ее остаточного члена 


——_/"(&;) означает, что аппроксимация (13.19) имеет второй 


порядок точности относительно шага й. 


Простейшие аппроксимации второй производной. Из 
представления 


Л(@) = @;)+ Го) -х)+ 
Он 


ГВ, + 


имеем 


2" 3 рт 4 ри 
Иры ор РО, ЕР О ИУ (бы). 


2 6 24 
3 "(х. 4 ги 
(х)=Л@е)-и уе МЫ НЫ р т В, й ее 1) 


откуда почленным сложением получаем 


4 
Учи + У-1 = 2У; + тен)" в) Е, 


Выражая из последнего равенства Х”(х;), приходим к формуле 
симметричной аппроксимации }"(х;) с остаточным членом: 


, И 
теж (13.20) 


2 
й ‚ 
Остаточный член этой формулы и" (2;) с некоторым 


Е, Е (х;1, Хр) характеризует приближенное равенство 
".\_ У-1- 21+ У 
Ди) = РНЕ (13.21) 
й 
как аппроксимацию второй производной в точке х; второго 
порядка точности, т.е. с погрешностью 0). 

Ут 2: + У 
2 
несимметричной аппроксимации второй производной функции 
Г), т.е. для вычисления приближенных значений /”(х;_|) и 


Г" 1), дает лишь первый порядок точности. Действительно, 
по формуле Тейлора для второй производной имеем 

Л") = Л") + "6-х. 
Подставляя сюда вместо /”(х;) правую часть равенства (13.20), 
получаем 


. —- . . 2 
ЕЕ + иди)", 
й 12 


Из этого равенства при х=х;+1 и х=х;_1 следуют частные фор- 


мулы несимметричной аппроксимации второй производной с ос- 
таточными членами: 


. — . . 2 х 
р-р ум 
й 12 


То же отношение ‚› используемое в качестве 


, | 2 Г + т п? И 
нЕ 4 те 1)" ©). 
й 12 


С помощью формулы Тейлора можно вывести остаточные 
члены и других простейших аппроксимаций производных. 


Более общий подход для получения выражений остаточных 
членов интерполяционных формул численного дифференциро- 
вания состоит в дифференцировании остаточного члена интер- 
поляционной формулы Лагранжа [19, 61]. Согласно (8.13), 


(и+1) 
в.) =/)-ь@)=^— Фп <), — (322) 
(п+1! 


ы И 


где Г„(х) — интерполяционный многочлен Лагранжа, построен- 
ный для и+1 раз дифференцируемой функции /(х) по и+1 узлу 
хо, х,й , х„ (неважно, в какой форме), & — некоторая точка из 
интервала (хо, х„), а Пи. 1(х):= (х-хо)(х-х)й (х-х,). Из 
(13.22) следует 

Ки(х) = Л'(х) - <) = 


2.5 
^ (п+1! 


| (п, 1+ еечат, 69] (13.23) 


Если величина в] ограничена, то при подстановке в 


последнее выражение узловых значений х=х; (1=0,1,й ‚п) за 
счет П‚„.1(х;)=0 получим простую формулу остаточного члена 
аппроксимаций /’(х;) = ['’(х;) первой производной в узлах ин- 
терполяции: 
| 
аи. 
лед-год = 2 
(п+1! 


В случае равноотстоящих узлов х; = хо + Ш, который здесь, в ос- 
новном, и рассматривается, 


п, 1(х;), &е(ж,х,„). (@3.24) 


Пи) =" ‘аи ди", 
вследствие чего равенство (13.24) трансформируется в формулу 


(п)! 
Пед ое, (13.25) 
(и+1)! 
Из нее отчетливо видно, что при аппроксимации первой произ- 
водной в точках х; значениями у; := [/(х;), получаемыми диф- 
ференцированием интерполяционного многочлена и-й степени, 
остаточный член имеет и-й порядок относительно шага аппрок- 
симации Й. 

Воспользуемся формулой (13.25), чтобы выписать остаточ- 
ные члены несимметричных аппроксимаций первой производной 
(13.8) и (13.10). Прии=2, =0и71=2 из (13.25) следует 


и? 
Г’ )- у = 5 /"©о) 


2 
Г(аз)- 5 =7- Ут»). 
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Ставя эти формулы в один ряд с формулой (13.18), имеем: 


: Ву бука В 
= а) 
2 3 
’ — —4 ‚+3 ; 2 я 
Пе). = 327) 


Заметим, что формулы несимметричной аппроксимации 
ГО) (3.26) и Гр) (13.27) второго порядка точности 
имеют в остаточном члене вдвое больший коэффициент, чем 
формула симметричной аппроксимации (13.18). 

Для оценивания погрешности численного дифференциро- 
вания при значениях аргумента, не совпадающих с узловыми, и 
для получения остаточных членов приближенных формул 


2 (х) = Ю(х) при А >1 формула (13.23) малопригодна. В кни- 
ге [19] на основе интерполяционной формулы Ньютона для не- 
равных промежутков (8.43) и связей между разделенными разно- 
стями и производными выводятся следующие формулы остаточ- 
ных членов: 


+1) (п+2) 
Род-но-" о"Рд и, 9, (329 


ен! (+2) 
(и+1) 
г-но опа) + 
(п+2) (п+3) 
О п он Ап, бы, 4329) 


(и+2)! 
и вообще, для КЕ {0, 1Й ‚п 
гы - = 
[4 К! 
ель 


Имеются и другие, отличные от (13.28)-—(13.30) представле- 
ния остаточных членов и оценок погрешностей интерполяцион- 
ных формул численного дифференцирования [44, 101 идр.|. 

Так как остаточные члены формул численного дифферен- 
цирования выражаются через производные более высоких по- 
рядков, чем искомые производные, то «в чистом виде» подобные 
выражения остаточных членов малопригодны для практического 
оценивания погрешностей. Однако не стоит считать их совсем 


(и+3)! 


(Е ) ПР (х). (13.30) 


п+1 
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бесполезными. Во-первых, они важны для качественного срав- 
нения (например, по порядку) различных аппроксимаций произ- 
водных. Во-вторых, их можно применить для оценивания точно- 
сти результатов численного дифференцирования, пользуясь про- 
стейшими связями между производными и конечными (или 
разделенными) разностями, например, составляя таблицы конеч- 
ных разностей до требуемого в оценке порядка и принимая за 
тах|/ "0 (х] величину тах А Ив” в соответствую- 
щей области таблицы. В третьих, выполнение условий, при ко- 
торых справедливы те или иные формулы аппроксимации произ- 
водных на равномерной сетке, позволяет при вычислении значе- 
ний производных применять принцип Рунге двойного счета с 
разными шагами подобно тому, как это делалось в $ 12.5 при вы- 
числении интегралов (более подробно об этом см. в [78, 101]). 


Пример 13.1. Бесконечно гладкая функция у= Х(х) задана табли- 
цей своих значений и значений конечных разностей (табл.13.1). 
Таблица 13.1 
Ху 
.367879 


—0.035008 
1.1 


> 


> 
> 
[0] 
> 
[05 
— 


12 | 0.301194 0.003015 
1.31 0.272532 0.002727 


1.4] 0.246597 0.002468 
1.5 | 0.223130 0.002234 
1.6 | 0.201897 0.002020 
1.71 0.182684 0.001828 

0.001655 


0.015730 0.000159 
0.001496 
-0.014234 аи 
2.0 | 0.135335 
Е 


520 


оон 
о 
р о 
Тов 
Тоны 
Тов 
ро 
р о 
о ВИ 


Найдем приближения к значению /’(1.5), пользуясь простейшими 


аппроксимациями по формулам первого и второго порядков точности. 
Имеем: 


по формуле (13.16) 


газ, 0.21233; 
по формуле (13.17) 
11.5) = кН, —0.23467; 
по формуле (13.19) ы 
1.5) = ме -0.22350; (13.31) 
по формуле (13.26) 


‚ -3/(.5)+4/.6)- /Ц.-7) _ 
Г’(.5) = 6 60— 
0.2 

по формуле (13.27) 
1 4 7 (1.4 1 
+05) =13)-474.9+310.5) /орозз. 
0.2 
Если на основании данной таблицы конечных разностей посчитать, что 


—0.22243; 


тах тах 
т’ 
НЫ УЙ = 5 = 0.3 И тах ВА (х] = 3 = 0.3, 
хЕГ, 2 й хЕП!, 2] й 

то в соответствии с выведенными выше формулами остаточных членов 


находим следующие оценки абсолютных погрешностей для полученных 
приближенных значений /“’(1.5): 


я ^7. 0.1 = 0.015 для первых двух, 


= ==. 0.01 = 0.0005 для третьего, 


ге з - 0.01 = 0.001 для двух последних. 


Откроем теперь факт, что исходная таблица составлена для функции е * 
и, значит, /'(х)=-Х(х). Это позволяет сравнить полученные приближен- 
ные значения /’(1.5) с истинным /“’(1.5) =- / (1.5). Разница между при- 
ближенными значениями /’(1.5) (без учета знака) составляет 
соответственно 


0.01080, 0.01114, 0.00037, 0.00070, 0.00080 
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— числа, достаточно хорошо вписывающиеся в подсчитанные оценки 
находим оценку погрешности значения у”(0.1): 

Попытаемся при вычислении /”’(1.5) применить принцип Рунге. 
Считая, что невозможно пополнить таблицу новыми значениями функции, 
остается заложить процесс увеличения шага, т.е. включить механизм про- 
реживания таблицы. 

Примем за основу формулу симметричной аппроксимации второго 
порядка точности, а за начальный шаг — шаг й = 0.1 исходной таблицы. 
Обозначив приближенное значение }”’(1.5) через у’(й), в соответствии с 
правилом Рунге уточняем его по формуле 


ил, У@®)-у(2и) 
У(р)+ И 


Учитывая, что у’(й) = —0.22350 (см. (13.31)), а 
у'(@2®)= Ил =—0.22462, 


находим поправку Ричардсона 


ТО | побзтз, 


прибавление которой к у’(И) дает значение /“(1.5) = —0.223127, лишь в 
последнем знаке отличающееся от точного. Модуль этой поправки служит 
приближенной оценкой погрешности значения у’(й), как видим, неплохо 
согласующейся по порядку с полученной выше оценкой (0.0005). 

Для /"(1.5) по симметричной формуле (13.21) с шагом й = 0.1 имеем 


ооо ОЗУ о, 
с шагом 2й=0.2 — 
у"(0.2)= /а.3)-27(.5)+ 7.7) = 0.2239. 


0.04 
Поправка Ричардсона равна 


0.2234- 0.2239 = 0.00017: 


ее прибавление к значению у”(0.1) дает уточненное значение 
’.5) = 0.2234 - 0.00017 = 0.22323. 
В соответствии с выражением остаточного члена в (13.20), принимая 


пах“ 
тах |" ый —___^0.3, 
хе, 2] ры 


ых 


абсолютных погрешностей 


* 

) Указанные оценки могут быть немного точнее, если максимумы 
модулей конечных разностей при оценивании модулей производных, вхо- 
дящих в остаточные члены, учитывать только в используемой части 
таблицы. 
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|Г"@.5)- у"(0.1] < =. 0.01 = 0.00025; 


близок к ней и модуль поправки Ричардсона. Однако истинная ошибка 
0.2234—0.22313 = 0.00027, хотя и имеет тот же порядок, но превосходит ту 
и другую оценки. Это можно объяснить влиянием погрешностей округле- 
ния исходных данных, более заметным при приближенном вычислении 
старших производных (см. следующий параграф). Нетрудно видеть, что по 
содержащимся в таблице данным найти какие-либо значения пятой и по- 
следующих производных в принципе невозможно. 


Замечание 13.1. Обратим внимание на одинаковость структуры ос- 
таточных членов формул численного дифференцирования и интегрирова- 
ния, опирающихся на полиномиальное интерполирование данной функ- 
ции по системе равноотстоящих узлов с шагом Й. Вхождение в выражения 
остаточных членов старших производных, порядок которых определен- 
ным образом согласован с показателем степени шага, наводит на мысль о 
возможности и здесь, т.е. при численном дифференцировании, пользо- 
ваться понятием алгебраического порядка точности. Структура же самих 
формул приближенного дифференцирования, имеющих вид 


(= Ус), КЕМ, (1332) 
11 


позволяет строить конкретные формулы такого типа методом неопреде- 
ленных коэффициентов, подбирая коэффициенты с; в (13.32) (и, возмож- 


но, узлы х;) так, чтобы формула (13.32) была точна для произвольных 


многочленов некоторой фиксированной степени (например, наиболее вы- 
сокой при заданном Й) [12]. 
Так, желая получить приближенную формулу 


Х"(х) = сх; — В) + со 1(х;)+ сз; +й), 


будем подставлять в нее вместо Г(х) последовательно степенные функ- 


ции |, х, х?, вторые производные которых при любом х равны соответст- 
венно 0, 0, 2. Получаем систему 


С + с2 +63 =0, 
сх; й) + сох, + сз (+ И)=0, 


(%- 1)? +2 + сз(х, + в} =2. 
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Считая, что в качестве х; может быть взята любая точка, полагаем х; =0, 
и из упрощенной таким образом системы 


С] +62 +63 =, 


(сз —С1 А = 0, 
(са +сз 12 =2 
1 2 
находим с = сз 5’ с> = 2 В результате приходим к формуле 
{"(х) ИВ ЛО ) а 2/(х,;)+ ЛО ) 
р > р2 , 


при хе [х,; 1, х/+1| точной для многочленов второй степени, а при х=х,, 


как нам уже известно (см. (13.20)), она точна для многочленов третьей сте- 
пени. 


13.3. ОПТИМИЗАЦИЯ ШАГА ЧИСЛЕННОГО 
ДИФФЕРЕНЦИРОВАНИЯ ПРИ ОГРАНИЧЕННОИ 
ТОЧНОСТИ ЗНАЧЕНИИ ФУНКЦИИ 


Откажемся от использовавшегося ранее обозначения 
у; = Г(х;) и будем полагать, что у; — это приближенное 


значение функции /(х) в точке х;. Предположим, что уровень 


абсолютных погрешностей значений у; в разных узлах х; при- 
мерно одинаков и ограничен числом д > 0. Таким образом, имеем 
Ла) у: (Е6), те. Ло) =(у-б, у+9). 

Будем изучать влияние неточностей задания (вычисления) 
значений функции на результаты аппроксимации производных 
по этим значениям для различных простейших формул. 

Рассмотрим простейшую формулу (13.15) аппроксимации 
первой производной в узле х; правым разностным отношением: 

, _ Ленл)- Ло) й п 
тот 6 = 
й 2 
Так как при вычитании приближенных чисел их абсолютные по- 
грешности складываются, то замена неизвестного точно разност- 


Ло)- Л@;) 
ного отношения Я реально вычисляемым отноше- 
ИЯ 
нием м порождает ошибку, оцениваемую по модулю ве- 


„ 29 р 
личиной —- А поскольку погрешность аппроксимации /“’(х) 
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ани - Роз) 


точным отношением ——_______ в соответствии с выражени- 


М 
ем остаточного члена можно оценить величинои А, где 


М> = т |№"(>х), приходим к неравенству 
хе Х- 
Уч Я «28. + М» 
й. 
Г@)- о - 


Итак, полная абсолютная погрешность приближенного ра- 
венства 


Пет (13.33) 
оценивается величиной 
ва, (13.34) 


образованной двумя слагаемыми: вычислительной погрешно- 
стью, порождаемой неточными значениями функции, и погреш- 
ностью аппроксимации, связанной с выбором формулы числен- 
ного дифференцирования. При Й —> 0 за счет первого слагаемого 

функция 2(Й) бесконечно растет; при сравнительно больших Й с 
ростом Й также будет наблюдаться рост &(й) (асимптотически 
линейный), благодаря второму слагаемому. Схематично поведе- 
ние графика функции © =& и) отображено на рис. 13.2. 


опт 1 


Рис. 13.2. Зависимость границы полной погрешности (13.34) 
приближенного равенства (13.33) от шага й 
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Не вызывает сомнений существование такого значения 
Й = Йрпт, при котором верхняя граница ©(й) полной погрешности 
приближенного равенства (13.33) минимальна. Это значение лег- 
ко найти, приравняв нулю производную функции $(й). Имеем: 


М 
= 26 + ЗЕ — 0 ы 
и? 2 
[) = = 
откуда Я =2 м — оптимальный шаг. Из этой формулы 


2 
видно, что сделать аппроксимацию производной в точке х; при- 
ближенным разностным отношением (13.33) сколь угодно каче- 
ственной можно лишь в том случае, когда величину д можно 
сделать сколь угодно малой (тогда можно рассчитывать на ма- 


лость Инт, ЧТо, в свою очередь, обеспечит малость 


мин = &(Йи)). Реально же при машинных вычислениях дело 
обстоит следующим образом [12]. 


В лучшем случае, значения функции по точности ограниче- 
ны лишь разрядностью мантиссы ЭВМ. Тогда, грубо полагая 


т 
6б=2"”, М> =1, находим, что Язнт =2:2 2 и , следовательно. 
т 
Е т 
9-2 2. т — 
Эна Ио =2.2 2. (13.35) 
2.2 2 


Этот результат говорит о том, что ири простейших аппроксима- 
циях производной с помощью правых разностных отношений 
(очевидно, для левых — то же самое) происходит потеря точ- 
ности, составляющая половину значащих цифр числа. Такой вы- 
вод не является для нас неожиданным (по крайней мере, качест- 
венно), поскольку потеря первых слева значащих цифр при вы- 
читании близких значений функции при составлении таблиц 
конечных разностей с малым шагом уже обсуждалась в гл.8; 
здесь же эти разности еще делятся на малый шаг, что ведет к 
увеличению абсолютной погрешности приближенных значений 
производной. 

Для формул численного дифференцирования более высоких 
порядков точности ситуация с потерей значащих разрядов в ре- 
зультатах их применения обстоит несколько лучше. Действи- 
тельно, рассмотрим в тех же условиях, например, формулу сим- 
метричной аппроксимации второго порядка точности для {’(х;). 
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Полагая Мз = тах|/"(х], согласно (13.18), аналогично преды- 
дущему имеем: 


‚ У - У 8 т 
х НЕ (=, 
Х'(х;) 2 &(#) а 
откуда, решая уравнение 
М 
а, 
2? 3 


[35 
находим Ване Теперь, если посчитать для простоты 
3 


1 т 
М; =3, &=2", получим диеты 9 и 
э 
эт з.=т 
8мин = 8(®шт) = и +52 3 в 2 
2 3 


Как видим, в этой ситуации можно рассчитывать на сохранение в 
приближенной производной примерно двух третей двоичных 
разрядов, имевшихся в исходных значениях функции. 
Симметричная формула второго порядка точности для вто- 
рой производной (13.20) в реальных условиях обеспечивает со- 
хранение половины разрядов, как и рассмотренная выше форму- 
ла первого порядка точности для первой производной. Действи- 


тельно, с тах|/” (х) = М4 из (13.20) имеем оценку 


се ааа 
Г"р-2ы ЯУ < 49. ‚М4 |? = 2(®), 


12 22 12 
с 39 
наименьшее значение которой реализуется при Йзит = 
4 
= 9% 
При М4 =3, 6=2" получаем шт =2-2 4 и &т=2.2 2 


(сравните с формулой (13.35)). 

Каждое последующее (повторное) дифференцирование вле- 
чет новые потери точности. Об этом можно судить, во-первых, 
по росту показателя степени Й с ростом порядка производной в 
знаменателе формул численного дифференцирования, во-вторых, 
по пропаданию значащих цифр в конечных разностях увеличи- 
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вающихся порядков, лежащих в основе этих формул. Для полу- 
чения приближенных значений удовлетворительной точности 
при вычислении производных достаточно высоких порядков мо- 
жет потребоваться огромный запас знаков в значениях функции, 
что трудно обеспечить на практике. 


Замечание 13.2. [92] Посмотрим с той же точки зрения на форму- 


1 

лы численного интегрирования. Пусть интеграл / := [Гоа вычисляется 
—1 

с помощью какой-либо квадратурной формулы / = У Ару; ‚ и пусть, как и 
1 

выше, /(х;)= у; (+9). Тогда, так как У\ А; =2 (в общем случае, при ин- 


1 
тегрировании на промежутке [а, 6] должно быть >. А; =Б-а), то 
1 


< 


у =» = у УХ АЛ) + >. 4. (и) - У 4, 


< 


+20. 


1-У Ао) 
р 


+4, | Ла)-л ЕИ->АЛО) 

1 7 
Последнее равенство характеризует квадратурный процесс как численно 
устойчивый: независимо от числа используемых для приближенного вы- 
числения интеграла значений функции, содержащих ошибки в пределах 
интервала (-д, 6), связанная с этим ошибка результата оценивается ве- 
личиной 0(6), т.е. того же порядка, а это позволяет заботиться лишь об 
обеспечении требований к малости =>0 погрешности применяемой квад- 
ратурной формулы (разумеется, при условии б<=). 


Невозможность сделать погрешность аппроксимации про- 
изводных разностными отношениями сколь угодно малой даже 
при убывании погрешностей вычисления значений функции вы- 
нуждает считать задачу численного дифференцирования некор- 
ректной. Здесь нарушается одно из условий корректности, а 
именно, нет непрерывной зависимости точности результата от 
точности входных данных в том смысле, что в процессе й > 0 
ошибка в значениях функции может убывать, а ошибка результа- 
та — бесконечно расти. Покажем, что такое возможно [78]. 

Пусть значение функции Х(х) в точке х представляется по- 
следовательностью приближений у;„(х) с ошибками, умень- 
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: 2 
шающимися при А —> © по закону а т.е.) 
: ы 
=: УКЕМ. (13.36) 


Тогда, если при использовании формулы правой аппроксимации 


производной 
„/@+п)-/@) 
т р 
вместо /(х) будут подставляться приближения ух (х), т.е. будет 


ГЕ (13.37) 
применяться формула 


1) = ©) кии 


то порождаемая такой подменой ошибка на основе (13.36) при 
каждом Ке М будет составлять величину 


Е зи? (х + в)}- зи (к? х)_ 


) 


КЙ 
2 
251 ЕЯ со А? Ба : [8 
2 э $5Ш 5 $ р 
А оо 6] 
КИ 2 2 
2 


Последнее представление показывает, что если К >® ий->0 


так, что КИ -—> 0, то величина ошибки Е может неограниченно 
возрастать. Следовательно, уд (х) № Г’(х). 


Попытаемся убедиться в том, что задача численного диф- 
ференцирования на самом деле регуляризуема, и что, например, 
только что рассматривавшаяся формула (13.37) аппроксимации 
производной правым разностным отношением при определенных 
условиях на шаг й может считаться для нее регуляризирующим 
оператором в смысле определения 1.5 из $ 1.7. С этой целью в 
терминах $ 1.7 ставим задачу так: требуется найти приближенно 


* 

) Обратим внимание, что здесь, в отличие от рассуждений, прово- 
дившихся в начале этого параграфа, мы следим за ошибками, а не за оцен- 
ками их модулей. 
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значение у = в точке хе (а, Ь), считая, что вместо точных 


4/(х) 
ах 
значений /(х) при хе [а, 6] известны их приближенные значе- 

ния 


15 (<) = 16)+9() 
[@(х]<6 \Ухе[а,Ь]. (13.38) 


В соответствии с приближенной формулой (13.37) положим 


В(Х, «) = пены. 


такие, что 


где @ —Й положительный параметр, не выводящий х+а 
за пределы отрезка [а,Ь]. Тогда, согласно определению 1.5, 
а-регуляризованное решение поставленной задачи должно 


иметь вид 
= 5(х+а)- Г(х 
у, =в(Х,, (5-28 с 7) _ 
_ Деа)- ГО) , оао) 
[01 [21 
Так как по определению производной 


пена >, 


при &а->0, 


а, в силу (13.38), 
Ф(х+а)-Ф()] „25 
[2 И” 
то требуемая сходимость уу — ва НР будет наблюдаться в том 
случае, если 


ао к а ди Я (13.39) 
( 


Чтобы удовлетворить (13.39), достаточно подобрать параметр 


так, чтобы величина 77(6) стремилась к 


а=а(6) в виде & = 


нулю одновременно с р и при этом было б =0(1(6)). В таком 
случае будем иметь 
[2 26 
а=— >00 и = 27 (0 
76) 9 5/1(6) ря 


т.е. выполнение условий (13.39). 
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Возьмем, например, #(5):=\б. Тогда @а= =>, 


25 = г =2\5 и, следовательно, 


а 35 2 
У =, 45) - 2-5). (13.40) 


$. 
У5 


— конкретное регуризованное решение поставленной задачи, 
4/(х) 
Ах 


дающее устойчивые приближения к производной 


бом д >0. 

Продемонстрированный подход к проблеме численного 
дифференцирования при неточных данных и его результат 
(13.40) делают мотивированными рекомендации по в шага 
р аппроксимации первых производных по формулам первого 


порядка точности типа й=О \/5), где 6 — уровень погрешно- 


стей вычисления значений функции (или й= утазйеру, если 
есть основание считать д = тазйерз ). 


при лю- 


УПРАЖНЕНИЯ 


13.1. Выведите частные формулы аппроксимации второй производ- 
ной в равноотстоящих узлах, основываясь на кубической интерполяции 
(например, из общей конечноразностной формулы (13.11)). 


13.2. Запишите симметричную формулу четвертого порядка точно- 
сти для аппроксимации /”(х;) и выведите ее остаточный член, используя 
формулу Тейлора. 

13.3. Убедитесь, что выведенные в $ 13.2 с помощью формулы Тей- 
лора выражения остаточных членов простейших аппроксимаций первой и 
второй производных являются частными случаями общих формул (13.28), 
(13.29). 

13.4. Выведите общую формулу численного дифференцирования, 
привлекая интерполяционную формулу Ньютона для неравных промежут- 
ков (8.43). 


13.5. Непосредственной подстановкой убедитесь, что приближенная 
формула 
" С 1)-2/1(0)+ /(®) 
ии 
точна для произвольного многочлена второй степени. 
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13.6. Запишите формулу полной погрешности и найдите выражение 
оптимального шага таблицы значений функции /(х) при аппроксимации 
первой производной по формуле несимметричной аппроксимации второго 
порядка точности, считая, что абсолютные погрешности значений функ- 
ции в узлах не превосходят 6 и что тах|/”(х) < Мз. 


13.7. Укажите значения оптимального шага и наивысшую гаранти- 
рованную точность аппроксимации первой производной функции 
у=5шлх посредством вычисляемых с предельной абсолютной погрешно- 


стью б=10`© ее значений по различным простейшим формулам первого 
и второго порядков точности. 


13.8. Найдите величины оптимального шага и оцените наилучшую 
точность, которая может быть гарантирована в условиях примера 13.1 
(см.$ 13.2) для различных рассмотренных там аппроксимаций первой и 
второй производных. 


13.9. Постройте простейший регуляризатор для задачи численного 


2 
_ 42) ь 
нахождения у т в условиях неточного вычисления значении 7(>) 


(с известным уровнем д абсолютных погрешностей). 
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ГЛАВА 14 || МЕТОДЫ ЭЙЛЕРА И РУНГЕ-КУТТЫ 
РЕШЕНИЯ НАЧАЛЬНЫХ ЗАДАЧ 
ДЛЯ ОБЫКНОВЕННЫХ ы 
ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИИ 


Ставится задача получения приближенных решений обык- 
новенных дифференциальных уравнений первого порядка с задан- 
ными начальными условиями. Уделяется внимание различным 
способам вывода численного метода Эйлера, являющегося наи- 
более простым частным случаем нескольких групи численных 
процессов разной идеологии. Рассматриваются непосредствен- 
ные модификации методов Эйлера; одна из таких модификаций, 
называемая исправленным методом Эйлера, приводит к семей- 
ству методов Рунге-Кутты второго порядка. Записывается 
общий вид формул Рунге-Кутты произвольного порядка, дается 
геометрическая интерпретация классического метода Рунге- 
Кутты четвертого порядка, обсуждаются вопросы пошагового 
контроля точности при реализации методов, приводится алго- 
ритм Кутты-—Мерсона, решающий проблему автоматического 
выбора расчетного шага при численном интегрировании по- 
ставленной начальной задачи с заданной точностью. 


14.1. ПОСТАНОВКА ЗАДАЧИ. КЛАССИФИКАЦИЯ 
ПРИБЛИЖЕННЫХ МЕТОДОВ. МЕТОД „ 
ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИИ 


Будем рассматривать обыкновенное дифференциальное 
уравнение (ОДУ) первого порядка 


у’ = Л(х, у), хе [хо В] (14.1) 
с начальным условием 


У(хо) = У, (14.2) 


где /(х, у) — некоторая заданная, в общем случае, нелинейная 
функция двух переменных. Будем считать, что для данной задачи 
(14.1)—(14.2), называемой начальной задачей или задачей Коши, 
выполняются требования, обеспечивающие существование и 
единственность на отрезке [хо,Б] ее решения у= у(х) (такие 
требования можно найти в любом курсе дифференциальных 
уравнений или в соответствующем разделе курса высшей мате- 
матики, см., например [109, 164, 166]). Более того, не оговаривая 
это отдельно, будем предполагать, что искомое решение облада- 
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ет той или иной степенью гладкости, необходимой для построе- 
ния и «законного» применения того или иного метода. 

Несмотря на внешнюю простоту уравнения (14.1), решить 
его аналитически, т.е. найти общее решение у= у(х, С) с тем, 
чтобы затем выделить из него интегральную кривую у= у(х), 
проходящую через заданную точку (хо; уд), удается лишь для 
некоторых специальных типов таких уравнений, описание кото- 
рых также можно обнаружить, например, в упомянутых литера- 
турных источниках. Поэтому, как и в родственной для (14.1)- 
(14.2) задаче вычисления интегралов, приходится делать ставку 
на приближенные способы решения начальных задач для ОДУ, 
которые можно разделить на три группы: 


1) приближенно-аналитические методы; 
2) графические или машинно-графические методы; 
3) численные методы. 


К методам первой группы относят такие, которые позволя- 
ют находить приближение решения у(х) сразу в виде некоторой 
«хорошей» функции ф@(х). Например, широко известен метод 
степенных рядов, в одну из реализаций которого заложено 
представление искомой функции у(х) отрезком ряда Тейлора, 
где тейлоровские коэффициенты, содержащие производные 
высших порядков, находят последовательным дифференцирова- 
нием самого уравнения (14.1) [62, 100 и др.]. Другим представи- 
телем этой группы методов является метод последовательных 
приближений, суть которого приведена чуть ниже. 

Название графические методы говорит о приближенном 
представлении искомого решения у(х) на промежутке [хо, В] в 
виде графика, который можно строить по тем или иным прави- 
лам, связанным с графическим толкованием данной задачи. Фи- 
зическая или, возможно, точнее будет сказать, электротехниче- 
ская интерпретация начальных задач для определенных видов 
уравнений лежит в основе машинно-графических методов при- 
ближенного решения. Реализуя на физико-техническом уровне 
заданные электрические процессы, на экране осциллографа на- 
блюдают поведение решений дифференциальных уравнений, 
описывающих эти процессы. Изменение параметров уравнений 
приводит к адекватному изменению поведения решений, что по- 
ложено в основу специализированных аналоговых вычисли- 
тельных машин (АВМ). 

Наконец, наиболее значимыми в настоящее время, характе- 
ризуемое бурным развитием и проникновением во все сферы че- 
ловеческой деятельности цифровой вычислительной техники, 
являются численные методы решения дифференциальных 
уравнений, предполагающие получение числовой таблицы 
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приближенных значений у; искомого решения у(х) на некото- 
рой сетке х; е[хо,Ь] значений аргумента х. Этим способам и 
будет посвящено дальнейшее изложение. Что делать с получае- 
мыми численными значениями решения, зависит от прикладной 
постановки задачи. Если речь идет о нахождении только значе- 
ния у(Б), тогда точка Б включается как конечная в систему рас- 
четных точек х;, и все приближенные значения у; = у(х;), кроме 
последнего, участвуют лишь как промежуточные, т.е. не требуют 
ни запоминания, ни обработки. Если же нужно иметь прибли- 
женное решение у(х) в любой точке х, то для этого к получае- 
мой числовой таблице значений у; можно применить какой-либо 
из способов аппроксимации табличных функций, рассмотренных 
ранее, например, интерполяцию (гл.8) или сплайн-интерполя- 
цию (гл.11). Возможны и другие использования численных дан- 
ных о решении. 


Коснемся одного приближенно-аналитического способа 
решения начальной задачи (14.1)—(14.2), в котором искомое ре- 
шение у = у(х) в некоторой правой окрестности точки хо явля- 
ется пределом последовательности получаемых определенным 
образом функций у„(х). 

Проинтегрируем левую и правую части уравнения (14.1) в 
границах от хо дох: 


х х 
Гуда = [ а, УФ). 
№ х 
Отсюда, с учетом того, что одной из первообразных для у’(х) 
служит у(х), получаем 


Ух) (хо) = | Аа, 


хо 
или, с использованием начального условия (14.2), 
х 
Ух) = хо + [Л ум. (14.3) 


№ 
Таким образом, данное дифференциальное уравнение (14.1) с на- 
чальным условием (14.2) преобразовалось в интегральное урав- 
нение (неизвестная функция здесь входит под знак интеграла; 
несколько более подробно об этом см. гл.18). 

Полученное интегральное уравнение (14.3) имеет вид зада- 

чи о неподвижной точке 

у=9() 
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х 
для оператора ф(у) := уд + [1 (6, (0) 4. Формально к этой зада- 


№ 
че можно применить метод простых итераций 
Уи = Ф(у„), п=0,1,2,й , (14.4) 


достаточно обстоятельно рассматривавшийся в гл. 3, 6, 7 приме- 
нительно к скалярным уравнениям, а также к системам линейных 
и нелинейных алгебраических и трансцендентных уравнений. 
Беря в качестве начальной функции уд(х) заданную в (14.2) по- 
стоянную уд, по формуле (14.4) при и =0 находим первое при- 
ближение 


э1(х) = уо + | 7<, хо). 


Хх 
Его подстановка в (14.4) при и =1 дает второе приближение 


ра 
у2(х) = хо + |1, у (0), 
№ 
и т.д. Таким образом, этот приближенно-аналитический метод, 
называемый методом последовательных приближений или 


* 
методом Пикара й. определяется формулой 


Хх 
Уи (х) = Уд + [Л (@, (и, (14.5) 
хо 
где и=0,1,2,Йй и уо(х) = уд. 

Хорошо изучена сходимость метода (14.5). В частности, не 
вдаваясь в подробности, констатируем один качественный ре- 
зультат [62]: 

если в некоторой односвязной области С, содержащей 

точку (х0; У0), 


Е? У) <С, бы У < С, 

то найдется такая постоянная й>0, что на отрезке 

[хо, хо +Й] последовательность функций у„(х), опреде- 

ляемая методом (14.5), равномерно сходится к решению 

У(х) задачи Коши (14.1)-(14.2) и справедлива оценка по- 
грешности 

и-+1 

д- бд с-ср- 


(и+1)! 
*) Пикар Шарль Эмиль (1856-1941) — французский математик. 
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Отметим две характеристики метода последовательных 
приближений Пикара, которые можно отнести к негативным. Во- 
первых, в силу известных проблем с эффективным нахождением 
первообразных, в чистом виде метод (14.5) редко реализуем. Во- 
вторых, как видно из вышеприведенного утверждения, этот ме- 
тод следует считать локальным, пригодным для приближения 
решения в малой правой окрестности начальной точки. Большее 
значение метод Пикара имеет для доказательства существования 
и единственности решения задачи Коши, нежели для его практи- 
ческого нахождения. 


14.2. МЕТОД ЭЙЛЕРА — РАЗНЫЕ ПОДХОДЫ К 
ПОСТРОЕНИЮ 


Учитывая ключевую позицию, которую занимает метод 
Эйлера в теории численных методов ОДУ, рассмотрим несколь- 
ко способов его вывода. При этом будем считать, что вычисле- 


Ь—хо 


ния проводятся с расчетным шагом й= ‚ расчетными 


точками (узлами) служат точки х; =хо+т (=0,1й ‚п) про- 
межутка [хо, 6] и целью является построение таблицы 


хмм | хи =Ь 
У [| м |= У 


приближенных значений у; решения у= у(х) задачи (14.1) 
(14.2) в расчетных точках х;. 


Геометрический способ. Пользуясь тем, что в точке хо из- 
вестно и значение решения у(хо)= уд (согласно (14.2), и значе- 
ние его производной у’(хо) = Г(хо, уд) (согласно (14.1)), можно 
записать уравнение касательной к графику искомой функции 
у=(х) вточке (хо; уд): 


У= 0 + Л(хо, У0)(х — хо). (14.6) 
При достаточно малом шаге й ордината 
я = 0+! (хо, 0) (14.7) 


этой касательной, полученная подстановкой в правую часть 
(14.6) значения х| =хо+й, по непрерывности должна мало от- 


личаться от ординаты у(х|) решения у(х) задачи (14.1)(14.2). 
Следовательно, точка (х|, у1} пересечения касательной (14.6) с 
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прямой х=х, может быть приближенно принята за новую на- 
чальную точку. Через эту точку снова проведем прямую 


у= я + Ля, яХх-м), 
которая уже приближенно отражает поведение касательной к 
у = у(х) в точке (ху; у(х1)). Подставляя сюда х=х>(=х+Й), 
иначе, пересекая эту «касательную» прямой х=хо, получим 
приближение значения у(х›) значением 


у2 = м +, У1), 
и т.д. В итоге этого процесса, определяемого формулой 


Ум = +, У;), 1=0,ЬЙ ‚п (14.8) 


и называемого методом Эйлера, график решения у = у(х) дан- 
ной задачи Коши (14.1)-(14.2) приближенно представляется ло- 
маной, составленной из отрезков приближенных касатель- 
ных (рис. 14.1), откуда происходит другое название метода (14.8) 
— метод ломаных. 


У= Уд +У'(хо Хх - хо) 


хо х х2 хз х 


Рис. 14.1. Геометрическая интерпретация метода Эйлера 


Применение формулы Тейлора. Описываемый здесь спо- 
соб вывода метода Эйлера тесно связан с предыдущим. 
Линеаризуя решение в окрестности начальной точки по формуле 
Тейлора, имеем 


УС бо) око) хо. 
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Отсюда при х = х| получаем 
УС) = уб +В в). (14.9) 


Точное равенство (14.9), переписанное в виде 


Ум) = я +п(Й), 
говорит о том, что здесь мы имеем одновременно как саму фор- 
мулу Эйлера для вычисления значения у| = У(х!) (сравните с 
формулой (14.7)), так и ее остаточный член 


= В», (14.10) 


где &| — некоторая точка интервала (хо, х1). 

Остаточный член (14.10) характеризует локальную (или, 
иначе, шаговую) ошибку метода Эйлера, т.е. ошибку, совершае- 
мую на одном шаге. Очевидно, что от шага к шагу, т.е. при мно- 
гократном применении формулы (14.8), возможно наложение 


ошибок”). За и шагов, т.е. в точке В, образуется глобальная 
ошибка; изучение такой ошибки будет проведено позже 
(см. $ 16.2). Сейчас же анонсируем один важный хотя бы для 
терминологии факт: порядок глобальной ошибки (относительно 
шага й) на единицу ниже, чем порядок локальной ошибки, а по- 
рядком глобальной ошибки и определяется порядок соответст- 
вующего численного процесса решения задачи Коши. Таким обра- 
зом, локальная ошибка метода Эйлера, согласно (14.10), есть 


0}, глобальная — О(й), т.е. метод Эйлера относится к ме- 
тодам первого порядка. 


Разностный способ. Рассматривая уравнение (14.1) в точке 
хо, с учетом (14.2) имеем равенство 


Ухо) = 1(хо, уо). 


*) Заметим, что в отличие от метода последовательных приближе- 
ний (14.5), являющегося итерационным по сути, все рассматриваемые 
численные процессы решения задачи Коши для ОДУ, и в частности, метод 
Эйлера (14.8), являются итерационными лишь по форме. На самом деле, 
это шаговые методы, в которых на каждом шаге выполняются однотипные 
действия; характерного для итерационных методов уточнения решения 
здесь не происходит. 
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Применяя к его левой части аппроксимацию производной пра- 


вым разностным отношением первого порядка точности (см. 
(13.15) при 1 = 0) 
У) Ухо) _ у’) 
У) == и 
й р. 
получаем 
Ух) Ухо) 
и тет о, х)+— > 
что идентично равенству (14.9), о йе формулу для 
вычисления у| вида (14.7) и локальный остаточный член (14.10). 
Ясно, что для получения общей расчетной формулы (14.8) мож- 
но было сразу применить аппроксимацию у’(х;) по формуле 
(13.16) в равенстве 
У'(х;) = Л(хь, у@х;)), (14.11) 
заменив неизвестное точное значение у(х;) известным прибли- 
женным значением у;. 
Заметим, что порядок получающегося таким способом ме- 
тода численного интегрирования дифференциальной зада- 


чи (14.1)-—(14.2) совпадает с ри аппроксимации производ- 
ной в левой части уравнения (14.1) 


ео, 


Квадратурный способ. Как было показано в $ 14.1, на- 
чальную задачу для ОДУ (14.1)-(14.2) можно заменить эквива- 
лентным интегральным уравнением (14.3). При х=х| из него 
получится равенство 


У(х1) = У + И (х, у(х))&. (14.12) 
0 
Применение к интегралу в правой части равенства (14.12) про- 
стейшей (одноточечной) формулы левых прямоугольников (12.6) 
дает приближенную формулу 


У) = Уд + Л(хо, (хо) — хо), 
правая часть которой, очевидно, совпадает с выражением (14.7) 
для подсчета значения у|. В общем случае расчетная форму- 
ла (14.8) метода Эйлера получается численным интегрированием 


посредством простейшей формулы левых прямоугольников в ра- 
венстве 


Же-июе О 4.13) 


я 
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в предположении, что на каждом 1-м шаге в роли начальной 
точки (20; о) выступает точка (х;; у;). Зная точность исполь- 
зуемой в (14.13) квадратурной формулы, легко прийти к тому же 
выражению локальной ошибки метода Эйлера, что и при других 
способах его построения. 


Существуют и другие подходы к выводу метода Эйлера. В 
частности, он будет возникать далее как частный случай некото- 
рых семейств численных методов решения задачи (14.1)-—(14.2). 


14.3. НЕСКОЛЬКО ПРОСТЫХ МОДИФИКАЦИЙ 
МЕТОДА ЭИЛЕРА 


Разовьем последний из подходов к построению метода Эй- 
лера. Очевидно, применение к интегральному равенству (14.13) 
других простейших квадратурных формул будет порождать но- 
вые методы численного интегрирования задачи Коши (14.1)- 
(14.2). 

Так, если в (14.13) использовать простейшую квадратурную 
формулу правых прямоугольников (12.7), придем к методу 


Унл = У + ИИ (ха, Уна), 1=0,Й ‚п. (14.14) 


Этот метод называют неявным (или обратным) методом Эйле- 
ра, поскольку для вычисления неизвестного значения 
Унл = У(х1) по известному значению у; = у(х;) требуется ре- 
шать уравнение, в общем случае нелинейное. Имеет ли свою 
сферу применения подобный метод, порядок которого такой же, 


как и у явного метода Эйлера (14.8) (первый”) ), и один шаг вы- 
числений по которому столь трудоемок? Положительный ответ 
на этот вопрос будет дан в гл. 16. 

Применение к интегралу в (14.13) простейшей квадратур- 
ной формулы трапеций (12.26) приводит тоже к неявному методу 


й . 
У = + И Ур) + Лань УЦ}, 1=0,,Й п, (14.15) 


который будем называть методом трапеций. Квадратурная фор- 
мула трапеций, как известно из гл.12, на порядок точнее формул 
левых и правых прямоугольников. Отсюда вытекает более высо- 
кий (на единицу) порядок точности метода трапеций (14.15) по 
сравнению с явным и с неявным методами Эйлера (14.8) и (14.14), 
т.е. метод трапеций (14.15) — это метод второго порядка (впо- 


следствии, в $ 15.4, к этому выводу придем из других соображений). 


* 
) Очевидно, локальный остаточный член метода (14.14) лишь знаком 
будет отличаться от локального остаточного члена (14.10) метода (14.8). 
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Некоторый интерес представляет совместное применение 
явного метода Эйлера и неявного метода трапеций. 

По форме равенство (14.15) представляет собой скалярную 
задачу о неподвижной точке относительно неизвестного значе- 
ния у;.1. Поэтому, если в правую часть (14.15) подставить хо- 


рошее начальное приближение м подсчитываемое по форму- 


ле (14.14), то тогда само это равенство можно считать шагом 
метода простых итераций для уточнения этого значения (см. 
гл.6). Таким образом, получаем гибридный метод 


й 
Уна = + Уд +В +) (14.16) 


1= 0; [И 


который называют методом Хойна [6, 60] (или Хьюна [138]). 
Ясно, что можно достичь большей точности, если, исходя 
из того же начального приближения 


0 
Унл = У + ИИ, У), 
сделать не одну, а несколько итераций по методу трапеций: 


, й 28 
УИ, зд + Икнь 0}, к=1,2,й . (14.17) 


Такой вариант совместного применения метода Эйлера и метода 
трапеций называют усовершенствованным методом Эйлера- 
Коши [84] с итерационной обработкой ). Делать много итера- 
ций по формуле (14.17) не рекомендуется (обычно их выполняют 
не более трех-четырех). Совпадение определенного числа разря- 
дов в полученных числах У) и Ут говорит о точности, с ко- 
торой решено методом простых итераций уравнение (14.15) от- 
носительно у;.|, а вовсе не о том, что с такой точностью 
найдено значение у(х;-1). 

Чтобы получить следующую модификацию метода Эйлера, 
проинтегрируем уравнение (14.1) по отрезку [х; 1, х;1|. Имеем 


Хх Х1+1 
руб = [Ус бах, 
Х-1 ХР 
откуда следует равенство 
Хх 
Ух) = Ури) + |Л(х, у)ах. (14.18) 


Х!-1 


* 
) Иначе, методом Эйлера с пересчетом [9]. 
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Применяя к последнему интегралу одноточечную квадратурную 
формулу средних прямоугольников (12.10) и заменяя значения 
У(х1) и У(х;) известными приближенными значениями у;_| и 
у; соответственно, из (14.18) выводим формулу для подсчета 
приближенного значения у(х; 1) 
Унл= У-1+ 2 (х;, у;), 1=1,2,...п-1, (14.19) 
которую будем называть уточненным методом Эйлера [58]. 
Как известно, квадратурная формула прямоугольников 
(средней точки) имеет тот же порядок точности, что и квадра- 
турная формула трапеций, так что уточненный метод Эйлера 


(14.19) тоже является методом второго порядка’). Подтвержде- 
нием этого факта может служить вывод метода (14.19) на разно- 
стной основе. Применив к равенству (14.11) формулу симмет- 
ричной аппроксимации у’(х;) второго порядка точности, 
получим 
У а, о), 
2й 

откуда после приближенной замены у(х;_1)= у, У(х;) = у,, 
У(х:+1) = урну следует (14.19). 

Обратим внимание на одно принципиальное отличие мето- 
да (14.19) от всех других рассмотренных до этого момента мето- 
дов: метод (14.19) является двухшаговым. Здесь для вычисления 
значения у;,| привлекаются два предыдущих значения у; и у; |. 
Двухшаговость накладывает определенные ограничения, по 
крайней мере, на начало численного процесса: значение 
у1 = у(х1) не может быть найдено непосредственно этим мето- 
дом с тем же шагом Й. Поэтому недостающую вторую началь- 
ную для процесса (14.19) точку приходится получать другим пу- 
тем, например, явным методом Эйлера, а чтобы не сделать сразу 
большой ошибки, применяя на старте метод более низкого по- 
рядка точности, рекомендуется осуществлять постепенное вхож- 
дение в процесс (14.19). Так, «разгон» можно выполнить по фор- 
мулам 


й й 
у, =20 +510, о), ИИ (+2, (14.20) 


а далее уже переключаться на счет по формуле (14.19). 


* 
) Другие его названия: метод Нистрёма (Нюстрема) второго по- 
рядка [6, 185], метод Милна второго порядка [198]. 
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Пример 14.1. Рассмотрим простое линейное уравнение 
у =2х-3Зу 
с начальным условием у(0)=1. На этой задаче легко проследить за вы- 


числениями, реализующими различные выведенные выше методы. Знание 


ее точного решения ия е в позволяет провести сравне- 
ние результатов приближенных вычислений по разным формулам с ис- 
тинным решением и проверить, насколько соответствуют представления о 
точности тех или иных методов тому, что наблюдается в данном, навер- 
ное, далеко не самом типичном частном случае. 

Сначала сделаем несколько последовательных приближений по ме- 
тоду Пикара. Его итерационная формула (14.5) для данной начальной за- 
дачи имеет вид 


х 
Уи (х)=1+х? —3| ум. 
0 


Подставляя сюда уд =1, при и=0,1,2 последовательно получаем: 


Е 
(<) =1+х2 -З|=1-3х+х2, 
0 


у: И 
У2(х)=1+х2 3] зи и 1-х? =. 
0 


х И Мы № 
уз (х)=1+х2 3} -+® кита Ва, 
ы 2 2 2 4 


Эти результаты удобно сравнить с точным решением, если в последнем 
разложить в ряд по степеням х фигурирующую там функцию е`З. Тогда 
получим представление решения в виде ряда 


|9 |9 


Уд =т-Зи+т д" ый мм. —й 


8 


’ 


с которым, как видим, хорошо согласуются приближения у|, у2, уз, оп- 
ределяемые методом Пикара. 

Теперь проведем подсчет приближенных значений решения у(х) 
данной задачи в точке х = 0.2 численным методом Эйлера и его модифи- 
кациями, принимая И =0.1 (т.е. за два шага). Результаты этих вычислений 
и фактические ошибки, найденные сравнением с точным значением 
У(0.2) = 0.581881й , отражены в следующей таблице. 
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= реррея 
Неявный Эйлера (14.14) =0.7846 | =0.6343 


Трапеций (14.15) =0.7478 =0.5788 =0.003 

Хойна (14.16) 0.755 =0.5895 | = 0.008 
Уточненный Эйлера в 

420] 0.755 0.587 =—0.005 


Последний столбец в этой таблице со всей очевидностью показывает 
большую точность методов второго порядка (см. три последних строки). 


14.4. ИСПРАВЛЕННЫЙ МЕТОД ЭЙЛЕРА 


Пусть найдено приближенное значение у; = у(х;) решения 
у=у(х) задачи  (14.1)-(14.2) и требуется вычислить 
Уна я У(хнл), где х;+1 =х, +й. Запишем разложение решения по 
формуле Тейлора р-го порядка, принимая за базовую точку х; 
(т.е. по степеням х-х;) и положим в этом разложении х=х;+1. 
Имеем 


} 1 м 
У(хн) = У(х;) + йУ + (х;) +й 
р АРУ ()+ ОР. (14.21) 
р! 


Если ограничится двумя слагаемыми в правой части разложения 
(14.21), то, согласно показанному в $ 14.2, получим обычный ме- 
тод Эйлера (14.8). Посмотрим, что дает учитывание третьего сла- 
гаемого. 
При р=2 из (14.21) следует равенство 
2) 


Ух) = У) + в) +7 у'(х)+0(3). (14.22) 


Значение первой производной в точке х;, в силу связи (14.1), 
приближенно известно: 


У(х,) = Ло, ух) = Го у,). (14.23) 


Дифференцируя (14.1), по формуле полной производной 
у"(х) = Л (х, у)+ Лу, уу 
находим приближенное значение второй производной: 
У"(х:) = Ля (хь, у(х,)) + Лу (хл» ух, Ух) = 
= Е» У) + Лу(хь У) у). 4.24) 


Подставляя приближенные выражения у(х;), у’(х;) и у’(х;) в 
равенство (14.22), получаем следующую формулу для вычисле- 
ния У; | = У(хн1) при 1= 0, Ъй ‚п: 


Ян =У + Убнь уд (е, У;)+ Ре УЛ и) (14.25) 


Определяемый ею метод будем называть исправленным мето- 
дом Эйлера. 

Так как при 1=0 формулы (14.23) и (14.24) точны, а 
У = (хо), согласно начальному условию (14.2), то на первом 
шаге вычислений по формуле (14.25) будет совершаться ошибка, 
связанная только с усечением ряда Тейлора. Следовательно, ло- 
кальная ошибка или, иначе, шаговая погрешность метода 
(14.25) составляет величину О 13 ‚ а это означает, что исправ- 
ленный метод Эйлера относится к методам второго порядка. 


14.5. О СЕМЕЙСТВЕ МЕТОДОВ РУНГЕ-КУТТЫ. 
МЕТОДЫ ВТОРОГО ПОРЯДКА 


Недостатком исправленного метода Эйлера (14.25) и других 
методов более высоких порядков, основанных на пошаговом 
представлении решения у(х) задачи (14.1)(14.2) по формуле 
Тейлора и последовательном дифференцировании уравнения 
(14.1) для получения тейлоровых коэффициентов, является необ- 
ходимость вычисления на каждом шаге частных производных 
функции Х(х, у). 


* 
Идея построения явных методов Рунге-Кутты ) р-го по- 
рядка заключается в получении приближений к значениям 


* ‚ 
) Г) Кутта Мартин Вильгельм (1867—1944) — немецкий физик и 
математик. 
2) Ранее типичным было написание «метод Рунге-Кутта»; в по- 
следнее время все чаще говорят и пишут «метод Рунге-Кутты». 
3) О неявных методах Рунге-Кутты можно прочитать, например, в [188]. 
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У(х;-1) по формуле вида 

У = У: + ф(х;, У й), (14.26) 
где ф(х, у, й) — некоторая функция, приближающая отрезок ря- 
да Тейлора (14.21) до р-го порядка и не содержащая частных 


производных функции Х(х, у). 

Так, полагая в (14.26) ф(х, у, й) = Х(х, у), приходим к мето- 
ду Эйлера (14.8), т.е. метод Эйлера можно считать простейшим 
примером методов Рунге-Кутты, соответствующим случаю р =1. 


Для построения методов Рунге-—Кутты порядка, выше пер- 
вого, функцию Ф(х, у, И) берут многопараметрической, и подби- 
рают ее параметры сравнением выражения (14.26) с многочленом 
Тейлора для у(х) соответствующей желаемому порядку степени. 

Рассмотрим случай р=2. Возьмем функцию ф в (14.26) 
следующей структуры: 


ф(х, у, й) = 1 Л(х, у) + с2Л(х + ай, у + БИГ(х, у)). 


Ее параметры су, со, а и Ь будем подбирать так, чтобы записан- 
ная, согласно (14.26), формула 


у = У: + Шей (хь, у) +с2Л(х; чай, у; +ЬИГ(х,, у;))]| (14.27) 
определяла метод второго порядка, т.е. чтобы максимальная ло- 
кальная ошибка составляла величину О(из ). 


Разложим функцию двух переменных Г(х + ай, у+ЬИХ(х, у)) 
по формуле Тейлора, ограничиваясь линейными членами: 


Л(х+ай, у+ЬИУ(х, у)) = Л(х у) Лу(х, уай+ 
р 2 
+ с, УИС, ›)+0(?). 
Ее подстановка в (14.27) дает 
Им=Я +1 | (с1 +62) Х(х,, У) +В (соай, (х„, у;) + 
+260 (м уз) Л(хь 9) |+0("°). (14-28) 
Сравнение последнего выражения с тейлоровским квадратичным 
представлением решения у(х) (14.22) с точностью до О(из) рав- 
носильно сравнению его с выражением у;.1 по формуле (14.25), 


т.е. с исправленным методом Эйлера. Очевидно, чтобы (14.28) и 


(14.25) совпадали с точностью о(из ), от параметров нужно 
потребовать выполнение следующей совокупности условий: 
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а +65 = Ь 
соа —=0т5, (14.29) 
СБ =:0:5:; 


Полученная система условий содержит три уравнения относительно 
четырех параметров метода. Это говорит о наличии одного свобод- 
ного параметра. Положим с> =@ (= 0). Тогда из (14.29) имеем: 

1 


В 1 
=—, А. 
2“ 2“ 
В результате подстановки этих значений параметров в формулу 


(14.27) приходим к однопараметрическому семейству методов 
Рунге-Кутты второго порядка. 


ня, ый уе. за + РЯ, ›,) 4430) 
2а 2а 


Выделим из семейства методов (14.30) два наиболее про- 
стых и естественных частных случая: 


с =1-а, а 


при а => получаем формулу 


Ум =У; +, У) + Ло, + у, 


в котором узнаём метод Хойна (14.16), полученный ранее из 
других соображений; 
при а =1 из (14.30) выводим новый простой метод 


Й й 
Уг-+1 Им тит ь (14.31) 


который назовем методом средней точки. 


14.6. МЕТОДЫ РУНГЕ-КУТТЫ ПРОИЗВОЛЬНОГО 
И ЧЕТВЕРТОГО ПОРЯДКОВ 


Любой метод из семейства методов Рунге-Кутты второго 
порядка (14.30) реализуют по следующей схеме. На каждом ша- 
ге, т.е. при каждом 1 = 0,1,2,й , вычисляют значения функции 


й й 
‚Ут т | 
[04 


т = <» У;), ур — Дм + 
2 2а 


а затем находят шаговую поправку 
Ду; = ПА -ди! +99 |, 


прибавление которой к результату предыдущего шага дает при- 
ближенное значение решения у(х) в точке х;+1 =х; +Й: 


У=У,+Ау;. 
Метод такой структуры называют двухэтапным по количеству 
вычислений значений функции — правой части уравне- 


ния (14.1) — на одном шаге. 

Анализ устройства методов Рунге-Кутты второго порядка 
позволяет представить, в какой форме следует конструировать 
явный метод Рунге—Кутты произвольного порядка. По аналогии 
с предыдущим для семейства методов Рунге-Кутты р-го поряд- 
ка используется запись, состоящая из следующей совокупности 
формул: 


т = Л(хь, у,), 

й К, 

Пк=Л| х чай У+йУЬит) | (14.32) 
= 


р ‚ 
Ун=У + СЕЙ, 
Г 


где =2,3,Й ‚р (для р-этапного метода). Многочисленные па- 
раметры сх, ах, Ву, фигурирующие в формулах (14.32), подби- 
раются так, чтобы получаемое методом (14.32) значение у; 
совпадало со значением разложения у(х;,1) по формуле Тейлора 


с погрешностью О(иР*1) (без учета погрешностей, совершаемых 
на предыдущих шагах). 

Наиболее употребительным частным случаем семейства 
методов (14.32) является следующий метод Рунге-Кутты 


Е 
четвертого порядка ), относящийся к четырехэтапным и 
имеющий вид: 


* 

) Как правило, когда говорят «метод Рунге-—Кутты», не сообщая о 
нем никаких дополнительных сведений, то под этим подразумевают 
именно данный классический метод четвертого порядка. 
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т = Х(хь у), 


Й = ен бет 7 , 
72 Г 2 й "т 


_ Ш й 
7 = [м ‚Я | (14.33) 


й/, : ке 
ЛУ; == (т +2 +21 +т ), 
Ул =; +АУ,. 


Не пытаясь воспроизвести выкладки, приводящие от общей 
записи семейства (14.32) при р=4 к конкретному методу 
(14.33), дадим геометрическое толкование последнего. 

Обратив внимание на то, что шаговая поправка Ду; есть 
средневзвешенная величина поправок 771, й772, #73, Ид каж- 
дого этапа (с весовыми коэффициентами 1/6, 2/6, 2/6, 1/6 соот- 
ветственно), проанализируем, как получаются эти поправки эта- 
пов. На первом этапе создается приращение й7| = И/(х,, у;) 
(= Ру'(х;)), соответствующее шаговой поправке Эйлера, — это 
очевидно. На рис 14.2 ему отвечает отрезок ВС вертикали 
х=х 1 (точка В получена ортогональным проектированием 
точки А на эту вертикаль). 


Рис. 14.2. Геометрическая иллюстрация одного шага 
метода Рунге-Кутты четвертого порядка 
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Так как точка М, благодаря свойству средней линии треуголь- 
р. р 
ника (см. ААВС), имеет ординату у; + т, то > определяет 


значение /(М), служащее (согласно связи у’ = Х(х, у) и геомет- 
рическому смыслу производной) тангенсом угла А в новом тре- 


угольнике с противолежащим этому углу катетом й17> = ВО. Да- 


лее, аналогично, подсчитав Г(М№) = АД +5, У; +1 =, на 


вертикали х=х;.| откладываем следующую промежуточную 
(этапную) поправку 2 = ВЕ. Вычислив величину 
У(Е)= {( +, у, +113), являющуюся значением  тангенса 


угла А во вновь получаемом ЛАВС , имеем поправку #1774 = ВС 
последнего этапа. Итоговая шаговая поправка Ду; = ВН есть 
продукт усреднения с указанными коэффициентами четырех 
этапных поправок — длин отрезков ВС, ВО, ВЕ и ВС. Точка Н 
будет стартовой для следующего, 1+ 1-го, шага метода (14.33). 

Заметим, что если первый этап, как уже упоминалось, соот- 
ветствует применению явного метода Эйлера, то четвертый — 
неявного, а второй и третий — уточненного методов Эйлера. По- 
следний имеет более высокий порядок точности, отсюда и боль- 
ший вес отвечающих ему значений этапных поправок. 


14.7. ПОШАГОВЫЙ КОНТРОЛЬ ТОЧНОСТИ. 
МЕТОД КУТТЫ-МЕРСОНА 


Нетрудно понять, что выведение надежных и, в то же вре- 
мя, простых и эффективных оценок погрешности, гарантирую- 
щих получение таблицы значений решения у= у(х) заданной 
точности, является делом малоперспективным, особенно для ме- 
тодов более-менее высоких порядков. Поэтому главным спосо- 
бом отслеживания точности при реализации численных процес- 
сов решения задачи Коши остается применение различных 
полуэмпирических правил, основанных на принципе Рунге 
(см. $ 12.5). 

Будем считать, что при использовании метода р-го порядка 
абсолютная шаговая погрешность должна находиться в пределах 
=> 0. Тогда, согласно приниипу Рунге, осуществляется счет по 
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системе узлов х;(й)=хо + с шагом Й и по системе узлов 


й .Р й : 
х) г = хо + 7 с шагом а При четных / вторая система будет 


м й ы 
совпадать с первой, т.е. м) == . Переход от расчетной 


Точки Хх; с приближенным значением решения в ней У к расчет- 
ной точке Х;+1 один раз совершается за один шаг длины й и при- 
водит к значению у,;.1(й) = у(х;.1(й)), другой раз — за два шага 


й й й 
длины 7 («транзитом» через точку х; +5 25 со значе- 


й й 
нием уз = 5 +7 и дает значение 


узи = у[хы [5 |= эчн 


Поправка Ричардсона в таком случае будет составлять величину 


й 
я) У2н2 (=) — Ункй) 
®(5) Ани ЗОНЫ (14.34) 
2 ЭР =] 


85) 
2 
й 
тать, что ошибка приближенного равенства у(х;-1)= ур 2) не 
р 
в 
85) 
2 


гаться дальше с более крупным шагом (например, удвоить Й). 


Если величина меньше заданного &, то можно счи- 


превосходит 5. Если же > &, то следует уменьшить рас- 


четный шаг й. При условии << & стоит попытаться дви- 


Пример 14.2 (продолжение примера 14.1, см. $ 14.3). 


Посмотрим, что дает применение принципа Рунге к нескольким 
простым методам численного решения того же уравнения у’=2х-Зу с 


начальным условием у(0)=1. Из точки х=0 перейдем в точку х=0.2 за 
один шаг й=0.2 четырьмя одношаговыми методами: явным и неявным 
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методами Эйлера, методом трапеций и методом Хойна — частным случа- 
ем метода Рунге-Кутты второго порядка. С помощью полученных значе- 


ний у = у(0.2) и найденных ранее теми же методами в примере 14.1 
значений ри = у(0.2) подсчитаем поправки Ричардсона 
й=0.1 й=0.2 
вол _ 22 СИ 
= 
22-1 


при р=1 для методов Эйлера и р=2 для методов трапеций и Хойна. Эти 
результаты, а также уточненные прибавлением к значениям У попра- 
вок Ричардсона |. ба приближенные значения Г а решения у(0.2) и 


их истинные погрешности у(0.2)- пы сведем в следующую таблицу. 


й=0.2 =0. = Й=0. =й=0. й=0.1 
О [ет | Уно [0.299859 | 5022) 2 
Неявный ЭЙ-/ (675; |„-0.0407| =0.5936| =-001 =—0.05 
лера (14.14) 


Трапеций |0 5692| = 0.0032 |=0.5820| =-0.0001 = 0.003 
(14.15) 
Хойна (14.16)! 0.62 |=-0.0102|=0.5793| =0.0026 =—0.008 


В эту таблицу последним столбцом помещен последний столбец из 
таблицы результатов примера 14.1, содержащий погрешности значе- 
ний ры, Сравнение с ним столбца со значениями поправок Ричардсона 


показывает, что эти поправки хорошо отражают поведение погрешностей 
методов (хотя и не дают основания считать их модули оценками 
погрешностей), а предпоследнего — эффективность уточнения по правилу 
Рунге-Ричардсона. 


Грубо обозначенная здесь технология пошагового контроля 
точности численного интегрирования дифференциальных урав- 
нений и автоматического выбора расчетного шага при этом на 
основе двойного счета в такой непосредственной форме говорит 
о ее значительной «дороговизне». Действительно, предположим, 
что для решения задачи (14.1)—(14.2) применяется четырехэтап- 
ный метод Рунге-—Кутты четвертого порядка (14.33). Тогда вы- 
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полнение одного его шага с контролем точности по правилу Рун- 
ге потребует 11 вычислений правой части уравнения (14.1) (по 


р 
четыре для получения каждого из значений у;-1(Й), уз и 


й й 
У21+2 5 минус одно общее для у;+1(Й) и У2;1 5 ), что весьма 


затратно. 

Более «дешевый», но, возможно, менее строгий способ су- 
дить о том, достаточно ли малым выбран шаг Й расчетов по ме- 
тоду Рунге-Кутты четвертого порядка (14.33), — это вычисление 


при каждом = 0,1,2,Йй величин 
ре: 
т 12 


Считается, что если величина ©; не превосходит нескольких со- 
тых, то можно продолжить вычисления с данным шагом или пы- 
таться при переходе от 2 к 1+1 его увеличить; в противном случае 
шаг следует уменьшить, например, вдвое [62, 89, 188 и др.]. 

Стремление повысить вычислительную эффективность при- 
вело к появлению различных вычислительных версий методов 
Рунге-—Кутты, благо для этого в семействе методов (14.32) имеет- 
ся значительное число свободных параметров. Основные сооб- 
ражения, положенные в основу этих версий, таковы: нужно по- 
лучить формулы из семейства методов Рунге-Кутты (14.32), 
которые использовали бы одни и те же значения функции — 
правой части уравнения (14.1) — и определяли бы разные кон- 
кретные методы одного порядка (или смежных порядков, напри- 
мер, четвертого и пятого); при этом, чтобы по разности результа- 
тов подсчета приближенных значений решения по выведенным 
близким формулам (с одним и тем же шагом #(!)) можно было 
судить о точности одного из них. 

Приведем один из таких методов, который называется 
методом Кутты-Мерсона или, иначе, пятиэтапным мето- 
дом Рунге-Кутты четвертого порядка, а также методом 
вложенных форм [198]. 
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На 7-ом шаге решения задачи (14.1)—(14.2)) последовательно 
вычисляют: 


т = И(хь ур), 

т = Дячинат 

Е = [я + ет нет 
пи чат 


: й - 54, 
15 = Дм +, у; +т -5`18 +2ы }, 
_ р/. 

У =У,; +5 —3и3 +414 ) 


Ум = У; + +474 +15 } 
После этого подсчитывают величину 
К = 0.2] 1 У 


и проводят сравнения. Если значение К окажется больше задан- 
ного допустимого уровня абсолютных погрешностей =, то шаг 


р 
уменьшают вдвое [1 -5 я и возвращаются к началу второго эта- 


па, т.е. заново вычисляют 172, 73 ит.д. Если К < &, то считают 
У(х 1) = Урнл © точностью =. При переходе к следующему шагу 
делается проверка на возможность увеличить расчетный шаг: ес- 


= 
ли А < ть то далее расчет ведется с шагом й:=2й. 


Другие методы подобного типа можно найти, например, в 
монографии [6], где кроме приведенной модификации Мерсона 
метода Рунге-Кутты содержатся описание и расчетные формулы 
модификаций Фельберга и Ингленда. 


Замечание 14.1. Осуществить апостериорный контроль глобаль- 
ной погрешности, т.е. погрешности последнего вычисленного тем или 
иным шаговым методом значения у„ = у(х„)= у(Б), можно, например, 


следующим образом [62]. 
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Из интегрального равенства (14.3) при х = х„ имеем 


У(хи)= Уо + № (х, у(х))аХ. (14.35) 


№ 


Считая, что численным методом получена достаточно густая равномерная 
сеть приближенных значений у; решения у(х) задачи (14.1)(14.2) и, сле- 
довательно, известны значения /, := /(х;, у;)= Л(х;, у(х,)), можно приме- 
нить какую-либо квадратурную формулу замкнутого типа для вычисления 
фигурирующего в равенстве (14.35) интеграла (в частности, для этих це- 
лей можно использовать алгоритм Ромберга, см. гл.12). Величина разно- 
сти между у„ и значением выражения уд +» А, 1, , где А; — коэффици- 
1 

енты используемой квадратурной формулы, позволяет приближенно 
судить о точности значения у„. Оснований для этого тем больше, чем 
выше точность выполняемой для такого приближенного глобального кон- 
троля квадратуры. 


УПРАЖНЕНИЯ 


14.1. Последовательным дифференцированием уравнения 
у’ =ху+1 
найдите его приближенное частное решение, соответствующее начально- 
му условию у(0)=0, в виде отрезка степенного ряда до пятой степени 
включительно. 


Можно ли получить тот же отрезок ряда методом последовательных 
приближений Пикара? Реализуйте пять итераций по формуле (14.5). 


14.2. Запишите совокупность формул, определяющих метод поша- 
говых последовательных приближений, основанный на применении к 
обобщающему (14.3) интегральному уравнению 


х 
5х) = у(х,) + [1 и 
Хх 
при каждом х; =хо + Ш фиксированного числа А итераций по методу Пи- 
кара (за у(х;) в этом уравнении должно быть принято значение в точке х; 
результата последней итерации). 
Опробуйте такой метод на задаче предыдущего упражнения, варьи- 
руя Й и К и добиваясь одинаковой точности результатов в точке х=2, за- 
давая эту точность самостоятельно. 


14.3. Проверьте справедливость численных результатов, приведен- 
ных в таблицах примеров 14.1 и 14.2 (см. $ 14.3 и $ 14.14). 


14.4. Убедитесь, что для линейного дифференциального уравнения с 
постоянными коэффициентами 


У=рУ+9 (14.36) 
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результат применения метода Рунге-Кутты второго порядка (14.30) не за- 
висит от выбора значения параметра с (= 0). 

Справедливо ли подобное утверждение для линейных ОДУ с пере- 
менными коэффициентами? 


14.5. Можно ли утверждать, что метод Рунге-Кутты второго поряд- 
ка (14.30), примененный к уравнению (14.36), приведет к тем же результа- 
там, что и исправленный метод Эйлера (14.25)? 


14.6. На задаче 
у=уе’-2у, У(0)=0.5 
протестируйте методы Рунге-Кутты второго порядка (14.30) при а=5, 


а =| и каком-нибудь другом & = 0, а также исправленный метод Эйле- 
ра (14.25), заполнив таблицу по образцу сводной таблицы результатов 
примеров 14.1, 14.2. Как ведут себя здесь поправки Ричардсона (14.34) 
сравнительно с истинными погрешностями? Насколько уточняются при- 
ближенные решения в результате прибавления поправок Ричардсона? 


14.7. Разработайте какой-либо конкретный алгоритм для реального 
воплощения описанного в замечании 14.1 (см. $ 14.7) способа приближен- 
ного апостериорного оценивания глобальной погрешности результатов 
численного интегрирования начальной задачи (14.1)—(14.2) методом Рун- 
геКутты второго порядка. 

Проверьте работу этого алгоритма в условиях упражнения 14.6 на 
отрезке [0, 1]. 


14.8. Запишите вид функции ф(х, у,й), при котором равенство 
(14.26) определяет классический метод Рунге-Кутты четвертого порядка. 
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ГЛАВА 15 || ЛИНЕЙНЫЕ МНОГОШАГОВЫЕ 
МЕТОДЫ 


На интегро-интерполяционной основе выводится несколько 
семейств методов численного решения задачи Коши для ОДУ, 
имеющих перед многоэтапными одношаговыми методами таких 
же порядков точности то преимущество, что требуют мень- 
ших вычислительных затрат, благодаря использованию инфор- 
мации о решении в нескольких предыдущих точках. Показывает- 
ся, как совместное применение явных и неявных формул одного 
порядка точности можно использовать для простого прибли- 
женного пошагового учета погрешностей. Наряду с конкрет- 
ными семействами многошаговых методов, таких как методы 
Адамса и Милна, рассматривается общая структура многоша- 
говых методов; демонстрируется возможность фиксирования 
параметров таких методов, исходя из понятия алгебраического 
порядка точности метода. Отмечается применимость всех 
рассматриваемых методов к решению систем дифференциаль- 
ных уравнений и уравнений высших порядков. Описано построе- 
ние методов Адамса и Адамса-Штёрмера для уравнений второ- 
го порядка. 


15.1. МНОГОШАГОВЫЕ МЕТОДЫ АДАМСА 


Как и в предыдущей главе, будем строить численные мето- 
ды решения начальной задачи 


у’ = Л(х, у), хЕж, В], (15.1) 


У(хо) = 0. (15.2) 
Будем считать, что уже найдено несколько приближенных 
значений у;=у(х,) (7=0,ЪЙ ‚7) решения у= у(х) зада- 
чи (15.1)—(15.2) на равномерной сетке х; = хо + М, и нужно по- 
лучить правило для вычисления очередного значения 
Унтя У(хнл). Для вывода таких правил используем интегро- 
интерполяционный подход. А именно, проинтегрировав левую и 
правую части уравнения (15.1) по промежутку[х;, х;1 |, в полу- 
ченном равенстве 


Ух) = У )+ И, ах (15.3) 


1 
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под интеграл вместо функции Х(х, у(х)) подставим интерполи- 
рующий ее многочлен Р,(х). Хотя выражение функ- 
ции /(х, у(х)), как функции одной переменной х, вообще гово- 
ря, неизвестно, ее дискретные приближенные значения 
Л(х›у;)= Г(х ,, У(х,)), обозначаемые в дальнейшем для крат- 
кости Л» при /=1,2,Йй ‚Г можно считать известными. В таком 
случае, дополняя эти известные значения пока что неизвестным 
значением 1-1 := (ха, Уд), можно построить таблицу конеч- 
ных разностей (табл.15.1), служащую основой для образования 
интерполяционных многочленов А-й степени для интерполиро- 
вания назад из точек (х;, /;) и (хит, Л). 

Таблица 15.1 


Таблица конечных разностей для построения 
конечноразностных формул Адамса 


При интерполировании назад из узла х; по второй интерпо- 
ляционной формуле Ньютона (8.28) имеем 


Ру(х)= Ру, (х; +ай) = Л; ва. «КО 


2 
и а, 


ЕЕ ИИ, И О, (15.4) 
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(см. конечные разности, подчеркнутые в табл.15.1 сплошной ли- 
нией), а из узла х;,1 по той же формуле получаем многочлен 


= = +1 
Р(х) = Вх +4) = Г +4Д% О, + 


р АВ ср +9941 (9+1 
3! - К! 
(использующий разности, подчеркнутые пунктиром). 
Подстановка многочленов Р, (х) и Р,(х) в равенство (15.3) 


приводит К формулам для вычисления очередного значения 
яя Ух) вида 


А’ Дьа (5.5) 


ХА 

У =: + | РЕодах (15.6) 
х 

+ 

ян =: + [РА бак. (15.7) 


х; 


В результате применения к интегралам в (15.6) и (15.7) фор- 
мулы Ньютона-Лейбница получается два семейства методов (с 
параметром Ке Мо), называемых многошаговыми методами 


* 
Адамса ). Рассмотрим по отдельности каждое из этих семейств. 


Экстраполяционные методы Адамса-Башфорта. Чтобы 
подставить в (15.6) многочлен (15.4), зависящий от переменной 
хх, Хх В 
‚ сделаем в интеграле |Р,(х)х замену переменной 
ы 
х=х; +ай, в соответствии с которой 


9— 


ХА 1 
ГРЕсдах = #| Ре, +авач. 
х, 0 


Тогда формула (15.6) может быть переписана в виде 
Уна = У + Ш, (15.8) 


*), 

) Адамс Джон Кауч (1819-1892) — английский математик и астро- 
ном. Одновременно с Леверье им было предсказано существование плане- 
ты Нептун. 
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где 


4? “_а4’\, > 
1. = | Р(х; + 91) а4 = м «р У + 
0 


4 5 4 3 1 
не ел мы = сми +й = 
0 


аи т А+ ААА А+. (15.9) 
Таким образом, на основе (15.8) получается следующая конечно- 
разностная формула, определяющая экстраполяционный метод 
'Адамса-Башфорта: 

уни + А+ +3 + мдм} (15.10) 

12 8 720 
Посмотрим, что представляют собой наиболее простые 
частные случаи метода Адамса-Башфорта, соответствующие 
нескольким первым значениям параметра К в формуле (15.8). 
Сразу заметим, что при фиксировании К = 0,1,2,й в (15.8) тем 
самым задается степень интерполяционного многочлена (нуле- 
вая, первая, вторая и т.д.) и, соответственно, число слагаемых, 
равное 1, 2,3, й , в правой части (15.9) (или, что то же, в скобках 
формулы (15.10)). Конечные разности в получающихся при этом 
конкретных формулах будем раскрывать через значения функ- 
ции, приводя формулы к виду, называемому иногда ординат- 
ным. Имеем: 


при А =0 
0=Л 2 уш=яи+ИСЬ ур); (15.11) 
при К =1 


| 3 1 
п=Л +5 АЙ = -5Л- > 


й 
Ум=У, +В» я)-1@ань у) 95.12) 


при А =2 


в 23. 16 5 
5 = +— АЕ = [ШЕЕ 
т ДЕ» т те. | ей 2 


й 
У=У, +12 3/6, у: )—16 7-1, Ур1)+ 
+51 (2.У,2); (5.13) 


при А =3 


За 55 59 37 9 
В бой а 5 
м 5 т 54-1 54-2 54-3 


й 
Ум=У; +45» У)-397 1, ура) + 
+371 (хр, У 2)-Э (хз, Уз). (5.14) 


Формулы (15.11), (15.12), (15.13) и (15.14) определяют ме- 
тоды Адамса-Башфорта соответственно первого, второго, 
третьего и четвертого порядков. Относительно порядка метода 
(15.11) сомнений нет: мы узнаём метод Эйлера (14.8), вопрос о 
порядке которого обсуждался в $ 14.2. Обоснование же утвер- 
ждения о порядках остальных перечисленных конкретных мето- 
дов состоит в следующем. 

В общем случае, для А +1 раз непрерывно дифференцируе- 
мой функции шаговая ошибка может быть получена сравнением 
равенства (15.6) с породившим его равенством (15.3), т.е. интег- 


Те, 

(+1! Бы 
интерполяционной формулы Лагранжа (см.(8.12)). Применитель- 
но к конечноразностной интерполяционной формуле (15.4) 
функция К, (х) преобразуется к виду 


рированием остаточного члена К, (х 


(&-+1) 
6) ни ак, — (5.15) 


Вь(х; +ай) = + 


т.е. может считаться величиной о“). Следовательно, локаль- 
ная погрешность метода типа (15.8) будет составлять величину 


1 
И] Кь(х; +айаа = о? ) а глобальная — величину о“ ) 
0 
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Таким образом, метод Адамса, порождаемый интерполирова- 
нием правой части уравнения (15.1) с помощью многочлена К-й 
степени, является методом (К-+1)-го порядка точности (от- 
носительно шага Й). 

Так как интерполяционный многочлен Р,(х) степени К 
строился по К+1 значениям Х;д, Л даь,й , Г, /;, использую- 
щим, в свою очередь, К +1 значений (вообще говоря, прибли- 
женных) Уи, Уи й ,УрьУ; = искомого решения у(х), а 
количество этих значений (даже если какие-то значения между 
УЕ И у; явно не участвуют) определяет шаговость метода, 
то для методов семейства (15.10) мы наблюдаем совпадение по- 
рядка метода с тем, сколькишаговым он является. Следователь- 
но, метод (15.12) — это двухшаговый метод Адамса-Башфорта 
второго порядка, метод (15.13) — трехшаговый метод Адамса- 
Башфорта третьего порядка, и т.д. 

Название экстраполяционный метод связано с тем, что 
интерполяционный многочлен Р,(х) для равенства (15.6) стро- 
ился по узлам, расположенным на промежутке [х;х,х;|, а при- 
менялся к отрезку [х;, х-1|, Т.е. производилось интерполирова- 
ние в широком смысле, а в сущности делалось экстраполирова- 
ние (по поводу нюансов этой терминологии см. сноски в $ 8.2). 
Понятно, что в названии рассматриваемого далее второго семей- 
ства методов Адамса слово «интерполяционный» употребляется 
в узком смысле. 


Интерполяционные методы Адамса—Моултона. В инте- 
грале, фигурирующем в формуле (15.7), делаем замену 
х=х;1+ай и подставляем в него выражение Р (х), определяе- 
мое формулой (15.5). Приходим к аналогичному (15.8) равенству 


Ум = У: +ШМЬ, 
где 
се. 25 г 4” 2 
Гр = | Ро +ав)аа = Даа Ги ет а + 
м 


4 5 4 3 0 
Па 3 119. 34а, Иа 2 |4 
+-—| —+а” +47 А + +—— +34“ А’ з+й = 
>: № 43 +4? №7 ао л 4” А’ 3 | 
А - ЧР --й . (15.16 
= лы - М - а АЗ АА . (15.16) 


12 
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Отсюда следует конечноразностная формула интерполяционно- 
го метода Адамса-Моултона 


1 | 
ре № Ао 
Ян = У [бы Ай 15 М 
19 


3 4 
ВЯ ий |. (8 
54-2120 А 3 | рей 


Аналогично тому, как это делалось для методов Адамса— 
Башфорта, при А =0,1,2,3, т.е. фиксированием одного, двух, 
трех, четырех членов в представлении (15.16) интеграла /, (х), 
получаем следующие частные формулы: 


при А =0 

ув = У + (ха, Уна), (15.18) 
при А =1 

Ум =У; + Аб Унл)+ Лав У (15.19) 
при А=2 

Уна = У; + БУ, уни) +8 (к, у;)- Ур, ура), 3.20) 
при К =3 


й 
У =; +В нь у ) +19 (х;, у;)- 


5 (жел, Ул) + Ор, Ур2)|. (15.21) 


Формулы (15.18) и (15.19) определяют уже известные нам 
методы, а именно, неявный метод Эйлера (14.14) и метод тра- 
пеций (14.15), имеющие первый и второй порядки точности со- 
ответственно. Заметим, что оба эти метода являются одношаго- 
выми, а следующие за ними методы Адамса-Моултона (15.20) и 
(15.21) третьего и четвертого порядков относятся, как легко ви- 
деть, соответственно к двухшаговым и трехшаговым методам. Та- 
ким образом, для интерполяционных методов Адамса-Моултона 
порядок шаговости на единицу ниже порядка точности метода 
(за тривиальным исключением, отвечающим случаю А = 0). 

Важное различие в экстраполяционных и интерполяцион- 
ных методах Адамса заключается в том, что первые из них явля- 
ются явными, а вторые — неявными. Эти термины однозначно 
определяют, о каком из двух семейств методов Адамса идет 
речь, а их сущность диктует особенности использования методов 
Адамса при практических расчетах, что найдет отражение в сле- 
дующем параграфе. 
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15.2. МЕТОДЫ ПРОГНОЗА И КОРРЕКЦИИ. 
ПРЕДИКТОР-КОРРЕКТОРНЫЕ МЕТОДЫ АДАМСА 


Под названием методы прогноза и коррекции (иначе ме- 
тоды предсказания и уточнения, предиктор-корректорные 
методы) понимается совместное применение явных и неявных 
методов одинакового или смежных порядков. По явной формуле 
значение решения у(х) задачи (15.1)-(15.2) в текущей (расчет- 
ной) точке х;.: прогнозируется, т.е. находится его, быть может, 
достаточно грубое приближение, а с помощью неявной форму- 
лы, в правую часть которой подставляется спрогнозированное 
значение, оно уточняется (корректируется). Пример приближен- 
ного вычисления у(х;.1) по такой явно-неявной схеме у нас уже 
есть: в $ 14.3 рассматривалось парное использование явного ме- 
тода Эйлера для предсказания и метода трапеций для уточнения 
(см. итерационную формулу (14.17), определяющую усовершен- 
ствованный метод Эйлера-Коши с итерационной обработкой). 

Остановимся подробнее на методах прогноза и коррекции, 
базирующихся на парах явных и неявных методов Адамса оди- 
накового порядка. Обозначим через НЯ приближенное значение 
решения у(х;.1), подсчитываемое по явной экстраполяционной 
формуле Адамса-Башфорта, и составим несколько пар из рас- 
смотренных в предыдущем параграфе частных формул Адамса- 
Башфорта (15.11), (15. а 13), (15.14) и Адамса-Моултона 
(15.18), (15.19), (15.20), (15.21). 

Имеем следующие предиктор-корректорные методы 
Адамса: 

первого порядка (он же явно-неявный метод Эйлера) 


Б 
|" = у; + АИ (хь у;), 
Б 
Уна =У;+ ВИ, Ул ) 


второго порядка 
У, + ВУ» У) -7 Обь 
Ум = У; Ибн, Ур )+ Л у )} 
третьего порядка 


й ь 
УТ= У: + 12 23/ у) -16 (хр Ур) +51 (хр, Ур 2) 


У 


— 


й 
ая бы бт )+ 81а, У) Роль 1) 


четвертого порядка 
р р 
Ум = У + 5а5/@» У) 59 (хрль Ур) + 


+37 я-а) 97-3, УЗ (15.22) 


й р 
Ум =У; + нь У )+ 197 (х;, У; )- 


У бь У) + Л (р, У2)]. 


Одним из главных достоинств методов прогноза и коррек- 
ции является возможность контролировать шаговую погреш- 
ность сравнением двух полученных по явной и неявной форму- 
лам приближений к у(х;.1). Покажем, как реализуется эта воз- 
можность для наиболее употребительного предиктор-корректор- 
ного метода Адамса четвертого порядка (15.22). 

Вспомним, что первая из формул (15.22) была получена из 
общей формулы Адамса-Башфорта (15.10), а вторая — из общей 
формулы Адамса-Моултона (15.17), в которых последними бра- 
лись разности третьего порядка (подынтегральная функция в ра- 
венстве (15.3) аппроксимировалась интерполяционным много- 
членом третьей степени). Считая, что расчетный шаг Й доста- 
точно мал и конечные разности с ростом их порядка убывают, 
главные части шаговых погрешностей формул Башфорта и Мо- 
ултона четвертого порядка, в соответствии с (15.10) и (15.17), 


251. 4 й 
характеризуются величинами и 4 для явной и 


19 
-755йА Л- для неявной формул. Таким образом, если наряду 


с введенным обозначением У обозначить через Ум прибли- 
женное значение у(х;.1), получаемое по формуле Адамса- 
Моултона четвертого порядка, то можно записать два прибли- 
женных представления у(х;.1): 


251 


Б 4 
У(хнл) = У + аройА Я (15.23) 
И 
(хня УМ и АА (15.24) 
о та | 720 11-3. з 


Отсюда видно, что если четвертые разности функции Х(х, у(х)) в 
используемой части табл.15.1 конечных разностей практически 
постоянны ( а это можно связать с удачным выбором величины 
шага Й при достаточном запасе знаков в значениях /(х,,у,)), то, 
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во-первых, значения и и у” | дают двусторонние приближения к 

точному решению у(х;+1), а во-вторых, через разность между зна- 

чениями и и ре можно оценить точность каждого из них. 
Действительно, приравнивая правые части приближенных 


равенств (15.23) и (1 ый и отождествляя Ги с А в имеем: 
+ 251 3 
У ВАА а ВАА аж А4 У, 
= 720 8 
откуда 


4 8(м 5 
ВА: д.3 ве — Ум ) 
Подставляя последнее в (15.24), получаем приближенное равенство 


М ы Б 
У(хнл) = У — ый - и (15.25) 


Использование приближенной формулы (15.25) может быть 
двояким. Переписав ее в виде 


19 (м Б ) 
270 УЕ = У 
в это для пошагового контроля ТОЧНОСТИ: 


М 
Ух 1)- т 


если и - УР <в, то полагаем у(х41)я а с точ- 


ностью о и переходим к следующему шагу (1:= 1+1), иначе 
уменьшаем шаг й и снова подсчитываем р и р 
Другое назначение формулы (15.25) — это прямое приме- 

нение ее правой части для получения уточненного значения: 
полагаем 


19 м 
5-6 А (15.26) 


Наверное, есть смысл контроль точности делать на каждом шаге, 
а к уточнению по формуле (15.26) прибегать при выводе оконча- 
тельных результатов. 


р 
У У 


Замечание 15.1. При выводе формулы (15.25) под м мы понима- 
ем значение, соответствующее «чистому» методу Адамса-Моултона чет- 


вертого порядка, т.е. р — это точная реализация неявной формулы 
(15.21). Вторая же формула предиктор-корректорного метода (15.22) соот- 


ветствует лишь одному приближению к т по методу простых итераций, 
где в качестве начального приближения берется жа Поэтому примене- 
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ния формулы (15.25) к методу прогноза и коррекции (15.22) будут убеди- 
тельны в том случае, если его вторая формула итерируется хотя бы один- 
два раза. Однако, чем больше таких итераций, тем ниже вычислительная 
эффективность этого метода, в целом весьма высокая по сравнению с мно- 
гоэтапными методами Рунге-Кутты. 


15.3. МЕТОД МИЛНА ЧЕТВЕРТОГО ПОРЯДКА 


Рассмотрим еще один широко известный метод прогноза и 
коррекции — метод Милна. 

Для вывода первой формулы Милна (т.е. формулы предска- 
зания) проинтегрируем данное уравнение (15.1) на промежутке 
[х-з, ха и в полученном интегральном равенстве 


Ухни) = Уз) + [Ле Уд) (15.27) 


Хз 


1-3 
подынтегральную функцию Х(х, у(х)) заменим первым интерпо- 
ляционным многочленом Ньютона Р-(х), построенным по четы- 
рем узлам х; 3, Хх; 2, Хх; 1, х; © предполагающимися уже извест- 
ными приближенными значениями 


Л-з = Л@нз» Унз)= У(хрз» У(хьз)), 

Л-2 = 1-2, 2) = Л(хро, У(х-2)), 

Л-:= Лань унл)= Убль У(хь1)), 
= Л(хьь У) = Л(хьь Убе). 


Тогда, после замены переменной хях;_з-+4й, на основании 
(15.27) имеем: 


4 4 
У(хнл) = Уз + "] Ру(х; з +ай)аа =уз +й [1-3 +43 + 
0 


а и, 9(9-19-2) \ АЗ 5+ 
3 Е 1— 


2 3 2 4 4 
1 1 
+1 Лч+ М3 -у е-е ел = 
0 


4 
и +516 ба Ау а 


Отсюда, выразив конечные разности через значения функции, 
получаем первую формулу Милна (предсказания) 


х 4 , 
У = У/-3 +3 Г, я)- И (рь ул) +21 5, у-2)] (15.28) 


которую, очевидно, следует отнести к экстраполяционным. 
Главный член локальной погрешности формулы (15.28) на- 

ходим интегрированием следующего (первого из неучтенных) 

слагаемого интерполяционного многочлена Ньютона. Именно: 


4 = == — 
обои) ди Ач ый = 


= ей — 64? +1 14? — ба) ча = ны й д а. 
24 0 45 
Считая четвертые разности примерно одинаковыми, опустим ин- 
декс у функции Г в записи д 3; в результате получаем сле- 
дующее приближенное представление решения в точке х;+ 1: 
бин) ых АА. (15.29) 


Вывод второй формулы Милна более прост. Проинтегриру- 
ем уравнение (15.1) теперь на промежутке [х; 1, х;+1| и в полу- 
ченном равенстве 


хит) = ил) ГУ Уса 


1 
применим к интегралу простейшую формулу Симпсона (12.30). 
Имеем 


бин) = нд нь ны) +4 би, ба) 


1 Ир 
+Л@-ь о (<;). (5.30) 
Отбрасывая здесь остаточный член и заменяя значения решения 
У(х;1) и у(х;) известными приближенными значениями у; 
и у;, а стоящее в правой части под знаком функции Х неизвест- 
ное значение у(х;.1) тем значением У,.1, которое получается в 


результате вычислений по явной первой формуле Милна (15.28), 
приходим ко второй формуле Милна (уточнения) 


й а 
Унл = У +3 Ин, Ун1) +471 (хр, у;)+ Лор ув], (15.31) 
являющейся интерполяционной. 


Для вывода приближенной оценки шаговой погрешности 
7 у 
воспользуемся приближенным равенством Х В -- где 
й 


Ау так же, как и в (15.29), — условная запись практически по- 
стоянных четвертых разностей. Исходя из точного равенст- 
ва (15.30), локальную погрешность получаемого с помощью 
формулы (15.31) (возможно, с итерационной обработкой, см. за- 
мечание 15.1) приближенного значения у;,| можно приближен- 


но охарактеризовать величиной 5 Ета 
й 4 
д тун-— АХ, (15.32) 
90 
Сравнение (15.29) и (15.32) дает: 
- й 4 й 4 Уна - У 
51 — Ул = 29—А > — Ам, 
Е АЕ 90 Л 90 Г 29 
следовательно, 
к Ува — Ува 
Убе) Уна Е. (15.33) 


29 


Таким образом, при численном интегрировании начальной 
задачи (15.1)—(15.2) методом Милна четвертого порядка, опреде- 
ленным формулами (15.28) и (15.31), на каждом 1-м шаге следует 
вычислять величину 


Ч : 29 
и сравнивать ее модуль с величиной = > 0 допустимой шаговой 
погрешности. Если |4;.1| < =, то за у(х;1) принимается получен- 
ное по второй формуле Милна значение у;,| (или его уточненное 
значение у;1 = уд +441); иначе шаг должен быть уменьшен. 
Фигурирующая в приближенном равенстве (15.33) посто- 


1 19 1 
янная — примерно вдвое меньше постоянной —— = — в ана- 
29 270 14 
логичном равенстве (15.25) для предиктор-корректорного метода 


Адамса четвертого порядка (15.22), что характеризует метод 
Милна как несколько более точный при одинаковых вычисли- 
тельных затратах. Но в дальнейшем (см. гл. 16, в частности, 
$ 16.5) появятся и другие критерии для сравнения этих конкури- 
рующих многошаговых методов. 
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15.4. ОБЩИЙ ВИД ЛИНЕЙНЫХ МНОГОШАГОВЫХ 
МЕТОДОВ. УСЛОВИЯ СОГЛАСОВАННОСТИ 


Все т-шаговые методы Адамса можно описать одной фор- 
мулой 


т 
ЯНВ ВО, Урны), (15.34) 
1=0 

где т должно быть фиксированным натуральным числом, а 1 
может принимать значения т -—1, т, т+1,й . При Ву =0 форму- 
ла (15.34) определяет явные, а при ру *0 — неявные методы, 
которые с единственными конкретными наборами коэффициен- 
тов 1, В›, Вз,й ‚Вт в первом и Ро, В, В›,й ‚Вт во втором 
случаях являются соответственно экстраполяционными и интер- 
поляционными методами Адамса. Как известно, т-шаговый ме- 
тод Адамса при достаточной гладкости решения имеет т-й по- 
рядок точности. Так как при любом его порядке для реализации 
одного шага требуется вычисление лишь одного нового значения 
функции (или двух при парном применении явных и неявных ме- 
тодов Адамса, см. предыдущий параграф), то при построении 
решения на большом промежутке выгодно применять методы 
Адамса достаточно высоких порядков. Но при этом возникают 
проблемы с вычислением первых т-1 «разгонных» значений 
Ур, У2, Уз)Й, Ут (Учитываем, что значение уд задано). Для 
их получения разработаны специальные процедуры разгона [6, 
62, 84]. Впрочем, можно обойтись применением для этих целей 
одношаговых методов Рунге-Кутты. 

Аналогично (15.34) при т =4 выглядят и формулы Милна, 
только в формуле прогноза (15.28) первым слагаемым стоит 
Уз, а в формуле коррекции (15.31) — у; 1. Похожий на (15.34) 
вид имеют также многошаговые методы Нистрёма, Хемминга и 
др. (см. [6]). Все эти методы можно описать формулой 


71 т 
Уна = Ха руны +В ины р» ны), (15.35) 
ри 120 


которая задает общий вид линейных многошаговых методов 
(приближенное значение решения у(х) в точке х,.| представля- 
ется в виде линейной комбинации нескольких приближенных 
значений решения и его производной в этой и в предшествую- 
щих 7 точках). 

К построению конкретных многошаговых методов, т.е. к 
фиксированию параметров &;, В; в формуле (15.35) при фикси- 
рованных значениях т =1,2,3,Й можно подойти следующим, 
отличным от рассмотренных ранее способом. 
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Обратившись к любой из выведенных в двух предыдущих 


параграфах многошаговых формул вычисления приближенного 
значения у;,1 решения у(х;-1) уравнения у’= (х, у), мы ви- 


дим, что локальная ошибка, точнее, ее главная часть, представ- 
ляется в виде (см. (15.23), (15.24), (15.29), (15.32)) 


Ух) ура = СИА У = СИН (Е) = СР (,, (15.36) 


где С и С; — некоторые постоянные, &; — некоторая точка, а 
К — порядок метода. Так как многочлен А-й степени имеет ну- 
левую (К +1)-ю производную, то, значит, метод получения у;-1, 
для которого имеет место (15.36), точен, если его решение у(х) 
— многочлен А-й (и менее) степени. 

Подмеченный факт приводит к мысли положить в основу 
построения методов численного интегрирования задачи Коши 
(15.1)—(15.2) алгебраический порядок точности, под которым 
здесь понимается максимальная степень А многочлена 
у(х) = Р, (х), обращающего в нуль погрешность (15.36). 

Будем подставлять в формулу (15.35), определяющую об- 
щий вид и-шаговых методов, в роли решения у(х) представите- 
лей многочленов Р,(х) — степенные функции 1, х, х2,й И. и 
будем считать, что такая подстановка вместо у; значений у(х }) 


не порождает погрешностей, т.е. получающиеся при этом равен- 
ства являются точными. 
Пусть А =0, т.е. возьмем у(х)=1. Тогда, так как У ‚)=1 
. ’ 
при любом значении /, а у’ = Г(х, у) =0, то (15.35) в этом слу- 
чае превращается в равенство 


Следовательно, параметры &@; любого из методов семейст- 
ва (15.35) должны подчиняться условию 


Ха; =1. Ч) 
Положим теперь А =1 и будем считать решением у(х)=х. 


В силу у’= Х(х, у) =1, результат подстановки такой функции 
в (15.35) приведет к равенству 


т т 
хи = Хан, + Ву, (15.38) 
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которое должно быть справедливым при любых 
1=т-1 т т-+Ьй . Взяв = т, исходя из выражения 1-го узла 


через шаг х; =хо +, от (15.38) приходим к равенству 


хо +(т+ в = Ха [хо +(т+1- +в. Д,. 
= 1=0 


Переписав его в виде 


т т ИД т, 
хо +(т+ = хо ха, +(т+Пйх а, -й > ла, +йУВ,, 
= = = 1=0 
учитываем найденное выше условие (15.37), в результате чего 


получаем простое требование ко второй группе параметров се- 
мейства т-шаговых методов (15.35): 


Ур, = У. (15.39) 


Совокупность требований (15.37), (15.39) называют усло- 
виями согласованности параметров линейных многошаговых 
методов (15.35). Нами они выведены как необходимые условия 
того, чтобы произвольный метод этого семейства имел, по 
меньшей мере, первый алгебраический порядок точности. Дока- 
зано [185], что они являются и достаточными для этого условиями. 


Посмотрим, что представляют собой одношаговые методы 
из семейства т-шаговых методов, т.е. зафиксируем в (15.35) 
т =1. Имеем трехпараметрическую формулу 
У = бу; + (Во + 8111). (15.40) 
Чтобы она определяла метод не ниже первого порядка, согласно 
условиям (15.37) и (15.39), должно быть 


и =1, + =1. 


Таким образом, остается лишь одна степень свободы, т.е. на са- 
мом деле, (15.40) — это однопараметрическое семейство одно- 
шаговых методов 


У = Ур + п [Вон + (1- В0)/:]. (15.41) 

При любом значении ру метод (15.41) точен для многочленов 

первой степени. Например, при ру =0 — это явный метод Эй- 

лера, а при Ву =1| — неявный метод Эйлера. Оба они точны, 
если решением задачи (15.1)-—(15.2)) является линейная функция. 

Попробуем подобрать параметр Ву так, чтобы форму- 

ла (15.41) была точной для многочленов второй степени, в част- 
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ности, для функции уУ(Сх)=х”. Для этой функции 
у’ = Х(х, у(х)) =2х, и через 1-й узел и шаг Й равенство (15.41) 
записывается так: 


(и +1)? = хр + Ио 2: +1) + (- Во)2хй. 
После элементарных упрощений в последнем равенстве прихо- 
дим к значению параметра ро =>, подстановка которого в 
(15.41) приводит к методу 
#а=3 бы +1). 


В нем мы узнаём метод трапеций (14.15), единственный из се- 
мейства методов (15.41) (иначе, единственный из одношаговых 
методов семейства (15.35)), имеющий второй порядок точности. 


Пусть теперь в общей формуле (15.35) т=2, т.е. будем рас- 
сматривать всевозможные двухшаговые методы этого семейства: 


У = бу; + а2 Ур + ИВЛ + ВЛ; + В2 1). (15.42) 


Потребуем, чтобы такой метод имел, по меньшей мере, второй 
порядок точности, т.е. чтобы подстановка в (15.42) вместо У; 


у 2 
значений У(х }) для у(х)=х’ оставляла это равенство точным. 


Учтем, что оно должно быть верным при любом #1=1,2,3,й ‚и 

что, в силу однородности функции — предполагаемого решения 
2 . 

у(х) =х°, можно считать {=1 и, соответственно, хо =0, м =Й, 


х› =2й. В этих точках решение у=х? принимает значения 


0, 12, 4й?, а его производная, т.е. функция Х(х, у(х))=2х — 
значения 0,2й,4й. Следовательно, при Г=1 равенство (15.42) 
приобретает вид 


48? =ай? +401? +281. 


Записав для этого случая еще условия согласованности (15.37), 
(15.39), получаем систему трех линейных уравнений с пятью не- 
известными параметрами: 


1 +42 =1, 
Во + Ву + В> = +292, (15.43) 
и +4Во +221 =4. 
Будем считать свободными параметры 
а=м и ВВ. 
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Тогда из системы (15.43) находим выражения остальных пара- 
метров: 
[й [0 
@2=1-а, =2-28-— , =В-— 
2 В В 5 В2 =В 5 


Их подстановка в (15.42) приводит к двухпараметрическому се- 
мейству двухшаговых методов, имеющих, по крайней мере, вто- 
рой алгебраический порядок точности: 


Ул = ау; +(1-@)у1+ р Вы + 


+(2-28-® [ри | (15.44) 


Легко видеть, что при о =1, В = 0 это семейство содержит част- 
ным случаем метод Адамса-Башфорта второго порядка 


(см.(15.12)) ‚ а при а =1, В => — метод Адамса-Моултона вто- 


рого порядка (15.19) (он же — метод трапеций, единственный из 
содержащихся в (15.44) одношаговых методов). 

Выберем еще одну степень свободы, потребовав, чтобы ме- 
тод (15.44) имел третий порядок. Аналогично тому, как получали 


третье уравнение системы (15.43), полагаем у(х)=х? и исполь- 
зуем значения этой функции 0, ИЗ, 8” и значения ее производ- 
ной 0, 312,121? на сетке ху =0, х=Й, х2 =2й в равенстве 
(15.44) с фиксированным 1 =1. Имеем: 


813 = ай +1283 *(6- 6В =, 


Га 
откуда получаем выражение р = т Таким образом, двухпа- 


раметрическое семейство методов, по крайней мере, второго 
порядка (15.44) превращается в однопараметрическое семейство 
методов, по крайней мере, третьего порядка 


ум = ау; +(-а)у1 + 


ни [+ +4 ин | (15.45) 


Распоряжаться оставшимся единственным параметром & 
в (15.45) можно из разных соображений. Например, чтобы фор- 
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мула (15.45) была явной, нужно обнулить коэффициент при 1-1, 
т.е. положить @ = —4. В результате этого приходим к двухшаго- 


вому методу третьего порядка (не встречавшемуся ранее) 
Ум =5 У, 1-4у;+й(41 +27). (15.46) 


Чтобы метод (15.45) относился к семейству (15.34) методов 
Адамса, следует обнулить коэффициент при у; 1, Т.е. взять @=1. 
При этом получаем известный метод Адамса-Моултона третьего 
порядка (15.20). Легко подметить, что при а = 0 формула (15.45) 
определяет метод Симпсона, иначе, вторую формулу Милна 
(15.31), имеющую, как известно, четвертый порядок точности 
(см. выражение ее остаточного члена, точнее, локальной ошибки 
в формуле (15.30)). 

Как будет выяснено позже, свободный параметр в много- 
шаговых методах может потребоваться для того, чтобы за его 
счет улучшить численную устойчивость метода. 


Замечание 15.2. Существуют линейные многошаговые методы, не 
вписывающиеся в общую формулу (15.35). К таким относятся так назы- 
ваемые методы с забеганием вперед. В основе вывода этих методов тоже 
лежит интегро-интерполяционный подход, но, в отличие от методов 
Адамса, опирающихся на второй интерполяционный многочлен Ньютона 
при аппроксимации подынтегральной функции Г в интегральном равенстве 
(15.3), здесь в том же равенстве (15.3) применяется интерполяционный 
многочлен Бесселя (8.33). Он использует более близкую к промежутку 
[хх | информацию о функции, что обеспечивает большую локальную 
точность. Однако в результате получаются формулы, в которых участвуют 
недоступные для непосредственного (и даже неявного) вычисления значе- 
ния, следующие за у;.1. Например, основная формула наиболее известно- 
го представителя методов с забеганием вперед — метода Коуэлла чет- 
вертого порядка — имеет вид 


й 
Ум = У, ЕЕ Ла +131 +13 - Л]. (15.47) 


Ясно, что одиночное применение таких формул невозможно, и методы с 
забеганием вперед реализуют совместно с другими, например, с методами 
Адамса. Так, выполнение одного шага метода Коуэлла (15.47) может осу- 
ществляться по следующему алгоритму. 

Считая уже известными с предыдущего шага значения у;, 
= У@рь Ур), У, вычисляем значение Х, = /(х;, у;); после этого 


проводим последовательные сближения по формулам, где 
0 _ (), 
Л = Л\нь, У . 


й 
У = ИТ ел — Ры) 


(методом Адамса-Башфорта второго порядка), 
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й 
ии бл чл -Л-) 


(методом Адамса-—Моултона третьего порядка), 
2). В. @ 
Уна = У) +1 —167 +51) 


(методом Адамса-Башфорта третьего порядка), 


Е й 2 
78 = + дана 
(методом Коуэлла четвертого порядка); 


после проверки на точность полагаем у;.,1 := у) ы 


Более подробно методы с забеганием вперед рассмотрены, например, 
в [100]. 


15.5. О ЧИСЛЕННОМ РЕШЕНИИ СИСТЕМ 
ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИИ 
ПЕРВОГО ПОРЯДКА 


Пусть требуется найти решение задачи Коши для системы 
обыкновенных дифференциальных уравнений первого порядка, 
разрешенных относительно производных: 


, 0 
я = Л, Уьй , Уи), (хо) = Ут, 
, . 0 
У2 = №2 (х, У» й ; Яя» У2(х0) = У2, 
, 0 
Уп = Ли (х, У» й „У У (хо) = Ул. 


Введем следующие векторные обозначения: 


, 0 
У У Л (х, уьй у») 7 
У = 72 ‚ у" = 72 , ре = №2(® уьй ‚У») 5 ® = У 8 
ет | И ах вов я т 
Уп Уп Ли (х, уьй м У0 


С ними данная задача Коши принимает вид 


У’ = Е(х У), УС)=И, (15.48) 


по форме точно такой же, как и рассматриваемая до сих пор за- 
дача (15.1)—(15.2). 

Легко понять, что к векторному дифференциальному урав- 
нению (15.48), в принципе, можно применить любой из числен- 
ных методов, изучавшихся в этой и в предыдущей главах (благо- 
даря линейной структуре методов). 

При этом скалярными величинами в формулах, опреде- 
ляющих методы, являются только независимая переменная х и 
расчетный шаг й; всем остальным величинам соответствуют 
введенные выше векторы размерности и. Следует лишь учесть, 
что при контроле точности вместо модуля нужно использовать 
норму вектора (например, норму-максимум). 


Пример 15.1. Дана начальная задача 
2 9 
у=е? ``" +2х, и = 0.5, 
2 

2=2у“ +2, 2(0)=1. 
Сделаем три шага явно-неявным методом Эйлера (предиктор- 
корректорным методом Адамса первого порядка), полагая й = 0.1. Пред- 
варительно для размерности и = 2 выполним покомпонентную запись рас- 
четных формул. Для данной системы они выглядят так: 


— =, +0.(е--Я +2х)), 
241=2, +0.1(2у2 +2,); 


ры =у; + 0.1(е Я -ы +2х; +0.2), 
=9 = * 
2 = 2; + 0.1(2741 +241). 


Результаты счета с небольшой точностью по этим формулам при 1 = 0, 1,2 
представлены следующей таблицей. 


. р = й тах {ут — ни} 
ж- У 2141 У 2 | 2,1} 
21 24 


[0 | 0-1 | =0.5287 | 1.15 | =0.5401 | =1.1709 | =0.2 | 
РЕ 022 | =0.5791 | =1.3463 | =0.5918 | =1.3726 | =0.03 | 


15.6. ЧИСЛЕННОЕ РЕШЕНИЕ ДИФФЕРЕНЦИАЛЬНЫХ 
УРАВНЕНИИ ВЫСШИХ ПОРЯДКОВ. 
МЕТОДЫ АДАМСА-_-ШТЕРМЕРА 


Одним из основных способов численного решения началь- 
ных задач для дифференциальных уравнений высших порядков 
является сведение их к соответствующим задачам для систем 
уравнений первого порядка. 
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Будем рассматривать уравнение второго порядка 


у" = Л(х, у, у’), хех, В] (15.49) 
с начальными условиями 
5(х) = У, У’) = У. (15.50) 


Введя новую переменную равенством 2=у’, от уравнения 
(15.49) переходим к эквивалентной ему системе 


У=2, 
, 15.51 
на. к 
Начальные условия (15.50) для нее перепишутся в виде 
У(хо) = 0, 15.52) 
в. а 


К задаче Коши (15.51)-(15.52), в соответствии со сказанным 
в предыдущем параграфе, можно применить любой численный 
процесс из рассмотренных. 


Альтернативой способу сведения к системам могут послу- 
жить методы, выводимые специально для уравнений высших по- 
рядков, например, на интегро-интерполяционной основе. Пока- 
жем, как может быть построен такой метод типа метода Адамса 
для задачи (15.49)—(15.50). 

Будем считать, что уже известны значения у; = у(х,), 
у; = у'(х;) и несколько предыдущих приближенных значений 
решения у(х) и его производной у’(х). Требуется получить 
формулы для вычисления величин узи у;+1 — приближенных 
значений функций у(х) и у’(х) в очередной расчетной точке 
хи =х;+Й. Для их вывода проинтегрируем уравнение (15.49) 
на промежутке [х;, х|, в результате чего приходим к интеграль- 
ному уравнению 


х 
Ух) = у) + [1 уу) (15.53) 
я 
относительно неизвестной функции у’(х). Зафиксируем в нем 
х=х1, заменим у’(х;) известным приближенным значением у’ 
Хх 
и подставим в интеграле |7(х, у(х), у'(х)) 4х вместо функции 
Хх; 


Л (х, у(х), у'(х)) интерполяционный многочлен Ньютона (второй) 
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Рь(х) = Р(х; +ай)= 1 +аА 1 Ол, +й 


х + 99+ (9+0 и Е В, (15.54) 


построенный по значениям 1; = (5, У,» у';) (где 
1=7-К,1-АК+ЪЬЙ ,1-ЪР). После интегрирования получаем ко- 
нечноразностную формулу 


, р 1 5 
Унл = Ур + Кл +547 + + 


3 251 

+54 Л +750А' 1-4 +й ) (15.55) 
которая представляет собой эктраполяционный метод Адамса- 
Башфорта (см. (15.10)), применяемый здесь для нахождения при- 

ближенных значений производной, а не самого решения. 
Для выражения значения у;+1 = у(х;.1) решения данной за- 
дачи через те же конечные разности, что участвуют в форму- 
ле (15.55), проинтегрируем равенство (15.53) в пределах от х; 


до х;+1. Имеем точное равенство 


Уи) = (хр) + ГБ’) + | Г, », У), 


которое заменяем приближенным равенством 


ХА $ 
У(хни) = ++ | [Л у, у)аах. (15.56) 


ХХ; 


Результат подстановки в правую часть последнего вместо 
Л(е, у), у’(@)) интерполяционного многочлена Р» (1) вида (15.54) 
принимаем за искомое значение у;-1, т.е. полагаем 


Хх 
Уа= ++ | [А@ачк. (15.57) 
ж Х 
Сделав замены переменных интегрирования х=х;+рй и 
1 = х; +ай, выполним двойное интегрирование многочлена: 
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Хх 21 В 
Г ГрФфаж = [ар ГР, +аваа = 


хх оо 
але ед Ял 
| о 29 +3) 4 в |ш- 
= Бреем ах «Це. р+р” ре + 
а ии +й |№- 
=® Л мА. ое А ав | 


Подставляя это выражение двойного интеграла в (15.57), получа- 
ем конечноразностную формулу для приближенного вычисления 
самого решения у(х) в точке х;-1: 


‚ 22 | Го 
У = У +В; + (х и, „й 263+ 
19 з 4 
+— А} сыр А —4+й |. (5.58) 
90 
Совокупность формул (15.55) и в определяют для за- 
дачи (15.49)—(15.50) семейство многошаговых экстраполяцион- 
ных методов Адамса в конечноразностном виде. Фиксируя в них 
порядок последней используемой разности, тем самым задаем 


шаговость и порядок метода”), причем первые из отбрасываемых 
слагаемых (с учетом множителя за скобками) грубо характери- 
зуют шаговую погрешность вычисления у;+1 И У;41. 

Например, при А =3 в (15.54), т.е. при использовании пер- 
вых, вторых и третьих разностей, из (15.55) и (15.58) получаем 
для задачи (15.49)-—(15.50) следующий явный четырехшаговый 


метод Адамса четвертого порядка (в ординатном виде): 


* 

) Если последними учитываются К-е разности, то в скобках фор- 
мул (15.55) и (15.58) берется А +1 слагаемых, что как раз соответствует 
шаговости и порядку метода. 


р ‚, й 
= ыы = ба ТА ь ВА 
и2 
Унл = Ур + йУ; + зн оКЛ —264/.1 +1591 › -381.-3). 
Главная часть локальной ошибки первой из формул (15.59) со- 


(15.59) 


251 .. 

ставляет величину 08 -4=0°), а второй — величину 
3 
АА 4=0) 
32 

Нетрудно вывести и неявные методы Адамса для задачи 
(15.49)—(15.50), подменяя функцию Х в равенствах (15.53) и 
(15.56) интерполяционным многочленом вида (15.54) с увели- 
ченными на единицу индексами, т.е. многочленом Рь (х;1 + ай). 
Совершенно очевидно, что для вычисления у;.1 при этом будет 
использована выведенная ранее интерполяционная формула 
Адамса-Моултона (15.17), где вместо у;, у1 следует записать 
соответственно у;, у;1. Вывод неявной формулы для вычисле- 
ния у;,1 предоставим читателю. На базе явных и неявных мето- 


дов можно устраивать предиктор-корректорные алгоритмы с 
пошаговым контролем точности. 


Рассмотрим, наконец, один частный вид уравнений (15.49), 
для которых вычисления по методу Адамса можно сделать более 
лаконичными. Именно, будем строить метод решения задачи 


Коши для уравнения 
= У), (15.60) 


правая часть которого не содержит производной. Обратив вни- 
мание на то, что в таком случае при вычислении значений Х; 
значения производной не требуются, вместо двух формул, реали- 
зующих явный метод Адамса (15.55), (15.58), можно попытаться 
ограничиться одной формулой (15.58), если удастся избавиться в 
ней от слагаемого Йу;. С этой целью выведем вспомогательную 
формулу типа (15.58), также содержащую слагаемое йу;, что по- 
зволит исключить его алгебраическим сложением формул. 

Проинтегрируем равенство (15.53), в котором вместо функ- 
ции Г(х, у, у’) будем подразумевать функцию Х(х, у) — правую 
часть уравнения (15.60), на промежутке [х; 1, х;|. Имеем 


У(х;) = Ух) +’) + | Ти, у(е))&ах. (15.61) 


Х-1 
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Подставляя сюда у; 1 вместо у(х; 1), у; вместо у’(х;) и тот же 
многочлен Ньютона (15.54) вместо подынтегральной функции 
Г, получим формулу, аналогичную (15.57): 


Хх; ра 
= уч | | Ва. (15.62) 
1-1 №} 
С теми же заменами переменных х=х; + рй и! =х; +ай произ- 


водим двойное интегрирование в (15.62) (см. выкладки при вы- 
воде формулы (15.58)): 


хх 20 Р 
Г ГрФфач = [ар[ Ву, +авдаа = 


хх, — 0 


1 1 1 1 7 
= "(57 ен +4 йо АЙ а АА д +й ) 


45 480 


Будем теперь рассматривать совместно получающуюся 
подстановкой в (15.62) этого выражения двойного интеграла 


формулу 
= (Атм + + 
ИРУ У: > 73 1 2 1-2 


2% 8 7 4 
+— АА +— А’ д-Й 15.63 
г 7-3 240 1-4 ( ) 


и формулу (15.58), где, как и в (15.63), считаем Л; = Г, У). 


Вычитая из равенства (15.58) равенство (15.63), приходим к фор- 
муле 


1 
Ум =2У;-Ур1+ ”(л +1 Ла + 
Гз 19 4 } 
А ой || 15.64 
те Л-з 240 7-4 ( ) 


<> .. * .. 
которая называется формулой Штёрмера ) или Адамса-Штеёр- 
мера. Как видим, метод Штёрмера решения начальной зада- 


* 
) Штёрмер (Стёрмер) Фредрик Карл Мюлерц (1874—1957) — нор- 
вежский геофизик и математик. 
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чи (15.60), (15.50) определяется одной явной формулой (15.64) и 
является более простым и экономичным по сравнению с базо- 
вым для него методом Адамса. 

Так же просто выводится и неявная формула Штёрмера, ко- 
торая может быть привлечена к организации вычислений по схе- 
ме «предсказание-уточнение». 


Замечание 15.3. Многошаговые методы прогноза и коррекции вы- 
соких порядков позволяют строить алгоритмы с автоматическим выбором 
шага, отличающиеся априорно высокой эффективностью. Однако практи- 
ка использования таких простых алгоритмов показывает, что их реальная 
эффективность значительно ниже предполагаемой из-за частых изменений 
величины шага. Поэтому непосредственно методы Адамса прогноза и 
коррекции на промежутках значительной протяженности целесообразно 
применять в тех случаях, когда вычисления можно проводить с некоторым 
наперед известным шагом. В противном случае применяют более эффек- 
тивные, создаваемые на той же многошаговой основе, специальные алго- 
ритмы Гира [6, 188]. 


УПРАЖНЕНИЯ 


15.1. Запишите явные и неявные формулы Адамса пятого порядка 
точности (в ординатном виде). 


15.2. Получите приближенные критерии пошагового контроля точ- 
ности в предиктор-корректорных методах Адамса: 

а) первого порядка; 

6) второго порядка; 

в) третьего порядка. 


15.3. Интегро-интерполяционным способом выведите предиктор- 
корректорные формулы третьего порядка точности, используя интеграль- 
ное равенство типа (15.3) на промежутке [х;_2 , х;41 |. 


Сравните пошаговую точность полученного метода с аналогичным 
показателем предиктор-корректорного метода Адамса третьего порядка 
(см. упр. 15.2, в). 


15.4. Выведите вторую формулу Милна и главный член ее локаль- 
ной ошибки, интегрируя уравнение у’= /(х, у) на промежутке 


хьхьи| и приближая подынтегральную функцию Х(х, у(х)) первым 
многочленом Ньютона третьей степени с базовым узлом х;_1. 
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15.5. Проверьте выполнение условий согласованности параметров 
в методах Адамса, Милна и в методе, выведенном в упр.15.3. 


15.6. Исходя из общего вида линейных многошаговых методов и 
понятия алгебраического порядка точности, опишите различные семейст- 
ва трехшаговых методов разных порядков. 


15.7. Для задачи, рассматривавшейся в примере 14.1 $ 14.3, вы- 
полните один полный шаг метода Коуэлла (15.47), считая й = 0.1. Оконча- 
тельный результат у) = у(0.2) и все промежуточные результаты последо- 
вательных сближений сравните с точными значениями решения в соответ- 
ствующих точках. 


15.8. А) Убедитесь в справедливости формулы Коуэлла (15.47). 


Б) Постройте метод не ниже третьего порядка точности на основа- 
нии интерполяционной формулы Стирлинга (8.32). 


15.9. Запишите расчетные формулы получения приближенных зна- 
чений решения задачи Коши для двумерной системы ОДУ предиктор- 
корректорным методом Адамса второго порядка. Выполните по этим 
формулам расчеты для задачи, поставленной в примере 15.1 $ 15.5. 


15.10. А) Выведите неявную конечноразностную формулу Адамса 
для численного решения задачи 


у" = Л(х, у, У’), У(хо)= Удо, У' (хо) = У. 


Б) Запишите четырехшаговый предиктор-корректорный метод 
Адамса для этой задачи и выведите приближенное правило пошагового 
контроля точности. 


15.11. Запишите частные формулы Штёрмера в ординатном виде: 


а) двухшаговые; 
6) трехшаговые; 
в) четырехшаговые. 


15.12. А) Выведите неявную конечноразностную формулу Штёрме- 
ра, рассмотрите ее частные случаи. 

Б) Запишите четырехшаговый предиктор-корректорный метод 
Адамса—Штёрмера и получите формулу для пошагового контроля точно- 
сти этого метода. 
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ГЛАВА 16 || О ПРОБЛЕМАХ ЧИСЛЕННОЙ 
УСТОИЧИВОСТИ 


Описывается общий принцип построения методов решения 
задач численного анализа и определяются связанные с этим по- 
нятия аппроксимации, устойчивости, сходимости. Показыва- 
ется реализация этого принципа при аппроксимации разност- 
ными уравнениями начальных задач для обыкновенных 
дифференциальных уравнений. Приводятся краткие сведения о 
решениях линейных разностных уравнений с постоянными ко- 
эффициентами, которые затем используются при изучении по- 
ведения решений и ошибок некоторых простейших схем. Вво- 
дится определение устойчивости по Дальквисту, дающее 
возможность легко выявлять неустойчивые многошаговые ме- 
тоды. С помощью примеров формируется представление о же- 
стких начальных задачах, дается определение жесткой систе- 
мы. Через понятие области устойчивости определяется 
А-устойчивость и А(@)-устойчивость разностных методов, 
обеспечивающие приемлемость этих методов для решения же- 
стких задач (в частности, выделяются чисто неявные методы 
дифференцирования назад, обладающие таким свойством). 


16.1. ОБЩАЯ СХЕМА РЕШЕНИЯ ЗАДАЧ 
ЧИСЛЕННОГО АНАЛИЗА. АППРОКСИМАЦИЯ, 
УСТОЙЧИВОСТЬ, СХОДИМОСТЬ 


Большинство задач численного анализа, будь то начальные 
или граничные задачи для дифференциальных уравнений, инте- 
гральные уравнения и т.п., достаточно естественно можно запи- 
сать в виде уравнения 


Е(у)=2, (16.1) 
где Е: У->Х — линейный или нелинейный оператор (или функ- 


ционал), переводящий элементы метрического пространства У в 
метрическое пространство 7. Суть приближенных методов ре- 
шения таких задач, как ясно видно из всего предшествующего 
материала, заключается в том, что уравнение (16.1) заменяется 
близким ему, в некотором смысле более простым (обычно ко- 
нечномерным) уравнением 


(У) = 21. (16.2) 


Это уравнение определяется оператором Е, : У, >И, соответст- 
вующим данному оператору РЁ и действующим из метрического 
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пространства У, в метрическое пространство Й„. При этом эле- 
менты у, ЕХ» и 2, Е Й/„ рассматриваются как образы элементов 
УЕУ и 2ЕЙ соответствующих исходных пространств, и такая 
связь задается некоторыми операторами сноса Ф„: У —>У, и 
Ин :й > Си, т.е. равенствами 
Уп = Фи(у), 21 =\и(2). 

Обратное соответствие между пространствами У, и У, а точнее, 
между У, и некоторым подпространством пространства У’, уста- 


навливается с помощью оператора восполнения фл: 


—1 
У-Фн (0). (16.3) 
Схематично связь между четырьмя фигурирующими здесь про- 
странствами показана на рис.16.1а. 


и» | 1 п 


> 
«— 
— 
> 
«— 


У 
а) 6) 
Рис. 16.1. К связи между задачами (16.1) и (16.2) 


Чтобы понять, как можно описать близость задач (16.1) 
и (16.2), проследим связь между пространствами У, 7, Дни 7, 
на уровне элементов (рис.16.16). 

Зафиксируем некоторый элемент уЕУ. Его образом в про- 
странстве 7, благодаря данному оператору Ё, будет элемент 
2=Р(у), а в пространстве 7„ с помощью оператора сноса у» 
получаем элемент у/„(Е(у)). С другой стороны, тому же элемен- 
ту у оператор сноса ф„ ставит в соответствие элемент 
Уи =@и(у) пространства У,, а ему, в свою очередь, новый опе- 
ратор Ё’, сопоставляет элемент Ё,(ф„(у)) пространства 7„. Так 
как элементы 2, = и„(Е(у)) и 2, =Е, (ф„(у)) служат образами 
одного и того же элемента у из У в одном и том же пространст- 
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ве И„, то по близости между ними можно судить о том, насколь- 
ко близки операторы Е, и Г. 


Определение 16.1. Говорят, что уравнение 
Е (у) =, (2) (16.4) 
аппроксимирует уравнение (16.1) (оператор Е„ аппрокси- 
мирует оператор Е), если для любых у из О(ЁЕ) < У мера 
аппроксимации 


р», (Еи(@(у)), и (Е(’))) (16.5) 


стремится к нулю при п. 
(Здесь >, (-, :) обозначает метрику, т.е. расстояние ме- 


жду указанными в скобках элементами пространства 7). 


Чтобы иметь возможность грубо сравнивать качество раз- 
личных моделей типа (16.4) задачи (16.1), часто используют по- 
нятие порядка аппроксимации, связывая стремление к нулю ме- 
ры аппроксимации (16.5) с порядком убывания какой-либо 
зависящей от и малой величины (шага аппроксимации). 


Предположим, что решения У ЕУи У, Е У, уравнений со- 
ответственно (16.1) и (16.4) существуют и единственны. По- 
скольку решение задачи (16.1) ищется в пространстве У, ее при- 
ближенным решением считается получаемый с помощью 
оператора восполнения (1 6 элемент, 


п —1 
И ( = Фи \Уи) 
* 
решение же у„ задачи (16.4) называется каркасом приближен- 


* К 
ного решения ). Наверное, главным вопросом любой теории 
приближенных методов решения задач вида (16.1 является во- 


прос о том, можно ли приближенным решением у ”) сколь угод- 
Ел 
но хорошо отразить поведение точного решения у , иначе, во- 
* 
прос о сходимости у(") ку. 
Определение 16.2. Говорят, что имеет место схо- 
димость приближенных решений у "к точному реше- 


* 

) Типичная ситуация: вместо точного решения — функции — на- 
ходят таблицу ее приближенных значений (каркас), а затем производят 
восполнение, например, посредством сплайн-интерполирования; естест- 
венно, что получаемое при этом приближенное решение принадлежит 
пространству более узкому, чем исходное пространство решений. Не сле- 
дует здесь воспринимать ф„ ' как обозначение обратного (в классическом 
смысле) к ф„ оператора. 
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нию у уравнения (16.1), если р, (”, У) 0 (т.е. 


* 
если расстояние между у(”) и у по метрике пространства 
У может быть сделано сколь угодно малым). 


Очевидно, имеет смысл рассматривать также сходимость 
каркасов приближенных решений, понимая под этим выполне- 
ние условия 


Ре”) — = #9. 


Подобно порядку аппроксимации, вводится понятие поряд- 
ка сходимости приближенных решений и (или) их каркасов. 
* ® 

Наличие фактических оценок величин р, \у„, ФУ ) по- 


зволяет не только делать выводы о сходимости приближенных 
решений и (или) их каркасов, но и указывать погрешности полу- 
чаемых приближений к решению. 
* 
Вопрос о сходимости приближенных решений у") ку 
тесно связан с тем, можем ли мы надежно получать каркас реше- 


НИЯ У» ‚ решая упрощенную задачу (16.4) (в предположении, что 
последняя аппроксимирует данную задачу (16.1) в смысле опре- 
деления 16.1)? Дело в том, что эта упрощенная задача (16.4), во- 
обще говоря, другая и тоже решается приближенно; улучшение 
качества аппроксимации, т.е. уменьшение ее меры (16.5), влечет 
увеличение размерности и решаемой задачи (16.4), а значит, рост 
объема вычислений, что, в свою очередь, может привести к ката- 
строфическому нарастанию вычислительных погрешностей. 


Определение 16.3. Вычислительный процесс называ- 
ется устойчивым, если малые погрешности исходных дан- 
ных вызывают малые погрешности результата (рост по- 
грешностей ограничен). 


В определении 16.3 заложено скорее понятие, чем строгое 
определение численной (иначе, вычислительной) устойчивости. 
Имеется ряд более конкретных определений численной устойчи- 
вости применительно к более конкретно поставленным задачам 
приближенных вычислений (см., например, далее определение 
16.4 в $ 16.5, определения 16.8 и 16.9 в$ 16.7). 

Одна из теорем численного анализа гласит: «Аппроксима- 
ция плюс устойчивость влечет сходимость». Ее доказательство 
(и более корректные формулировки) можно найти в книгах [12, 
67, 92, 100, 152, 158 и др.]. 
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16.2. ПРОСТЕЙШИЕ РАЗНОСТНЫЕ АППРОКС 
ЗАДАЧИ КОШИ. ГЛОБАЛЬНАЯ ПОГРЕШНОСТЬ 
МЕТОДА ЭИЛЕРА 


Вернемся к изучению численных процессов решения на- 
чальной задачи 


у’ = ЛС У), хЕ[хо, В], 


16.6 
У(хо) = 5%. уве 
Положив # = 0 ‚ введем на отрезке [ху, 6] равномерную 
Е п 
сетку’ 
ар :=4 хм =хо + (1=0,1й ‚п)}. (16.7) 


Функции, определенные во всех узлах х; сетки @,, называют 
сеточными функциями. Например, если некоторая функция 
у = Ф(х) определена в узлах сетки @,, то сеточной функцией 
следует считать функцию у; =9(х;) дискретного аргумента 
1=0,й ‚и, т.е. (п+1)-мерный вектор ( Ф(хо), Ф(х1),й ‚ Ф(х„)). 
В свете сказанного в предыдущем параграфе бесконечномерная 
дифференциальная задача (16.6), состоящая в нахождении удов- 
летворяющей ей функции — решения у = у(х), сводится к ко- 
нечномерной задаче вычисления (п+1!)-мерного вектора 
(у(хо), ух), й , у(х,)) — соответствующей этому решению 
у(х) сеточной функции у(х;) на @)„, другими словами, каркаса 
решения уд = (хо), 1 = Ум), й , У, = У(хи). Одним из 9 
новных приемов такого сведения является уже использовавший- 
ся в $ 14.2 разностный подход, т.е. рассмотрение уравнения 
(16.6) в узлах сетки @, и аппроксимация в них производной у’ 
через соседние значения сеточной функции, соответствующей 
исходному решению у = у(х) (иначе, замена дифференциального 
оператора разностным). 

Знание порядков используемых формул аппроксимации 
производной и их остаточных членов позволяет получать пред- 
ставление о порядке аппроксимации данной бесконечномерной 
задачи конечномерной, выводить оценки погрешностей прибли- 
женных решений (на сетке) и изучать устойчивость и сходимость 
каркасов решений. В связи с принятием за основу разностного 
подхода к построению конечномерных моделей дифференциаль- 
ных уравнений, эти модели называют разностными уравнения- 
ми или разностными схемами. 


* 
) Естественно, сетки бывают и неравномерными. 
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Положим в (16.6) х = х; и клевой части полученного равенства 
У'(х,) = Лаь У@,)) 


применим простейшие аппроксимации первого (6.15), (6.14) и 
второго (6.19), (6.26), (6.27) порядков. Имеем: 


ОВО) = д, +0, 


й 
и-ый = бе. у (16.8) 
А 
—Зу(х) + Дух) — УХ; 
О бы по, нру+07) 


тт = Ро Ус +О(?). (16.10) 


Отбрасывание в этих равенствах последнего слагаемого, характе- 
ризующего порядок аппроксимации, и замена в них точных зна- 
чений у(х ;) решения у(х) в /-х узлах сетки @, приближенными 


значениями У; приводит к следующим разностным схемам: 


Уч = У + И (х,, Ур), 1=0,1й ‚,п-1; (16.11) 
Ул = У; + И (хнль Уи), 1=0,1й ,п-1; (16.12) 
У = Ура + 2Й/(х,, У;), 1=1,2,й ,п-1; (16.13) 


Уна = 4; -Зур1 - 2 (хр, Ул), Т=Ь2,Й ,п-1; (16.14) 


4 1 2й : 
У = -32- +5 Убнь у), 1=Ъ2,й ‚п-1. (16,15) 


Первые три из схем (16.11)-(16.15) определяют хорошо знако- 
мые методы Эйлера: явный (14.8), неявный (14.14) и уточненный 
(14.19). Последние две схемы второго порядка представляют со- 
бой явный и неявный двухшаговые методы второго порядка, 
внимание которым будет уделено позже. 


До сих пор нами изучались лишь локальные ошибки мето- 
дов, т.е. ошибки, возникающие на одном текущем шаге в пред- 
положении, что исходным материалом для получения результата 
этого шага служат точные значения. Попытаемся теперь хотя бы 
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В простейших случаях изучить поведение ошибок в их взаимо- 
связи на соседних шагах и получить представление о процессе 
накопления методической погрешности к и-му шагу. Знание то- 
го, как изменяются погрешности от шага к шагу, позволяет де- 
лать выводы о численной устойчивости разностного метода и о 
сходимости поставляемых им каркасов приближенных решений, 
получать оценки глобальной погрешности. 


Обозначим 
6; = У(х;)- У, (16.16) 


— разность между значением точного решения у = у(х) зада- 
чи (16.6) в 1-м узле сетки (16.7) и соответствующей компонентой 
каркаса решения, получаемого тем или иным разностным мето- 
дом. 

Предположим, что правая часть и решение данной задачи 
(16.6) обладает достаточной гладкостью и выполняются условия 


3 Си, С>>0: | (х У] сь |) =С› Ухе[м,Б]. (16.17) 


В этом предположении оценим глобальную погрешность метода 
Эйлера. 

Вычитая из линеаризованного по формуле Тейлора выра- 
жения решения у = у(х) в точке х,.| получаемое явным методом 


Эйлера (16.11) значение у;.1, в соответствии с обозначением 
(16.16) имеем: 


бы = У(хна)- Уна = 
! 1 и 
= Ух) + у Ай+ЬУ (9:1? фу, - (ху; = 


1 и 
=0; + ИЛ (х;, УСх,)) - ЛО У (@р?. 


Применив к разности функций в последнем выражении формулу 
Лагранжа по второму аргументу, получаем 


! 1 и 
был = 61+ у, у) +5 (©; !?. (16.18) 


Таким образом, связь между ошибками в (1+1)-м и 1-м узлах 
описывается разностным уравнением 
9:41 = 4:9; + В,, 250; й ‚п-1[, (16.19) 
где 


‚ 1, 
Ар =1+ ИУ (хььу;), В, = (©;)/? (16.20) 
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(©; и у; — некоторые точки из области задания и области значе- 
ний решения у(х) соответственно). Анализировать это уравне- 
ние будем позже, а здесь произведем оценивание абсолютной 
погрешности, используя условия (16.17). Благодаря им из (16.18) 
получаем рекуррентное неравенство 


|6 < Аб +В, 1=0,ЬЙ ,п-1, 
где 
А=1+С1й, ВС. (16.21) 
Итерирование этого неравенства дает 
[6+ |< 4(46; |+ В)+В= 426, |+ (4+8 < 
< 4? (46, |+ В)+(4+ПВ = Аб, >| + (4? + А+} <й 
РЁ _ 
"=, 
А-1 


поскольку бу = у(хо)- уд =0, согласно начальному условию. 


При {=и-1 в соответствии с обозначением (16.21) отсюда полу- 
чаем оценку глобальной погрешности метода Эйлера 


в < Або + (+ АНТ ув АВ = 


) 


п 
О Зы ВЯ = С2й [| +С®)" Е] 
Св 2 2С, 


Чтобы проще было судить о порядке глобальной погрешно- 
сти, применим в правой части ее оценки формулу Ньютона и-й 
степени бинома. В результате имеем 


[6] < 


о) < СА (исуй+ ов) = С -жй+ (2) = О). 
2С' 2 


Как видим, глобальная погрешность метода Эйлера имеет 
первый порядок относительно шага й и совпадает по порядку с 
погрешностью аппроксимации дифференциальной начальной зада- 
чи (16.6) дискретной задачей (16.11) с начальным значением уд. 


Если при выводе разностных уравнений типа (16.19) для 
ошибок д; ограничиваться указанием только порядка свободных 
членов, то такие уравнения проще получать сравнением иссле- 
дуемых разностных схем с приведшими к ним результатами ап- 
проксимаций дифференциального оператора разностным. Про- 
демонстрируем это на неявном (16.12) и уточненном (16.13) 
методах Эйлера. 
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Перепишем равенство (16.8) в виде 


Ух) = (р) + Инь уен))+ 0?) 


и вычтем из него (16.12). Используя обозначение (16.16) и фор- 
мулу конечных приращений Лагранжа, имеем 


9 =9; + ИЛ нль УСА) = ЛОнльУнл] + (1? ) = 
Е 2 
= +, (худа + 0(?), 


откуда после разрешения полученного равенства относительно 
6;+1 приходим к тому же разностному уравнению (16.19), в кото- 


ром 
—1-@ нь) от Онь та) 


Аналогично, сравнение равенства (16.13), определяющего 
уточненный метод Эйлера, с эквивалентным (16.9) равенством 


УС) = Убе) +21, (хр) + 03) 


(16.22) 


дает 
9-1 =— 9:1 Ч 27 (х;, УСх;)) =, у;)] +0(#3)= 
= 91 + 217, (хр, У; 5; +0(3). 


Следовательно, ошибка двухшагового метода (16.13), основан- 
ного на симметричной формуле второго порядка аппроксимации 
производной, удовлетворяет трехточечному рекуррентному со- 
отношению 


6141 = 46; +9; 1 +0(и3), (16.23) 
где А; = 2й/,(х;, ;). 


16.3. КРАТКИЕ СВЕДЕНИЯ О РЕШЕНИЯХ 
ЛИНЕЙНЫХ РАЗНОСТНЫХ УРАВНЕНИЙ 
С ПОСТОЯННЫМИ КОЭФФИЦИЕНТАМИ 


Как видно из предыдущего параграфа и из предыдущей 
главы, численное решение дифференциального уравнения сво- 
дится к решению уравнения разностного, связывающего при- 
ближенные значения исходного решения в нескольких сосед- 
них узлах сетки, количество которых (минус один) определяет, 


сколькишаговым является численный метод. Разностным урав- 
нениям удовлетворяют и ошибки методов в узлах (см., например, 
(16.19), (16.23)). Поэтому для анализа приближенных решений 
дифференциальных уравнений и их погрешностей важно иметь 
представление о решениях разностных уравнений. 

Ограничимся некоторыми первичными сведениями о реше- 
ниях линейных разностных уравнений т-го порядка с посто- 
янными коэффициентами, имеющих вид 


и; 41 = аи; + а2и;1+й +ати_ти+Ь. (16.24) 


Изучение таких уравнений проводится аналогично изучению ли- 
нейных дифференциальных уравнений с постоянными коэффици- 
ентами. Так же, как и в дифференциальном случае, рассматрива- 
ется соответствующее (16.24) однородное разностное уравнение 


Инт = 910; + а2О;-1 +й +атО тт» (16.25) 


ищется его общее решение И;, представляющее собой линейную 
комбинацию и фундаментальных решений О; (Т=Ъай т), 
находится какое-либо частное решение и; неоднородного урав- 
нения (16.24); тогда общее решение и; уравнения (16.24) пред- 
ставляется суммой Ц; и и. 


Подобно тому, как в случае линейного дифференциального 
уравнения решение соответствующего однородного ищут в виде 
показательной функции, здесь нетривиальное решение уравне- 
ния (16.25) естественно искать в виде 


И:=Я (16.26) 
с некоторой неизвестной постоянной Й (= 0). Подставляя (16.26) 
в (16.25), имеем 
Я ый + чад", 
откуда после деления на Д^”*! приходим к уравнению 
ТТ о" В а, Ата. (16.27) 


Это уравнение называют характеристическим по отношению к 
уравнению (16.25) (а значит, и к (16.24)), поскольку уравнение 
(16.25) имеет решения вида (16.26) только в том случае, если Д 
есть корень алгебраического уравнения (16.27). 


Предположим, что все корни Д1, 42,й ‚Ам характеристи- 


ческого уравнения (16.27) — действительные различные. Тогда 
выражения 


Ип=М, Ир=Ж, й , Ит = № 
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образуют полную систему фундаментальных решений, и об- 
щее решение этого уравнения есть 


И = + +Й +стАь, (16.28) 


где с1,с2,й ‚си — произвольные постоянные. 

Такой же вид (16.28) будет иметь общее решение уравнения 
(16.25) и в случае, когда среди корней уравнения (16.27) есть 
комплексные, но нет кратных. Если же некоторое число А, явля- 
ется К-кратным корнем характеристического уравнения, то, 
опять-таки, подобно дифференциальному случаю, ему будет со- 
ответствовать К фундаментальных решений [158]: 


Я)» 1А), 
Обращаясь теперь к исходному неоднородному уравнению 
(16.24), непосредственной проверкой убеждаемся, что выражение 


_ Ь 
1-а1-а 2-й —ат 


п, И. 


и: 


(16.29) 
можно считать его частным решением (если в (16.29) знамена- 
тель не обращается в нуль). Таким образом, общее решение раз- 
ностного уравнения (16.24) есть функция целочисленного аргу- 
мента г, имеющая вид 


Ь 


и; =сй! +624 +й ен = 
1-@-а>-й —ав 


‚ (6.30) 
если 7; (]=Ъй ‚т) — простые корни характеристического 
уравнения (16.27), и содержащая слагаемые вида 


7 т .К-1 27 
С +С ИА +Й +Ск-и Яр, 


соответствующие каждому К -кратному корню 4. 

Для разностных уравнений, как и для дифференциальных, 
также можно ставить начальные и краевые задачи, задавая зна- 
чения и; при определенных значениях Г, что позволяет из общих 
решений фиксированием произвольных постоянных выделять 
частные решения, удовлетворяющие конкретной задаче. В этой 
главе для нас будут представлять интерес начальные задачи 
для (т+!)-точечных разностных уравнений (16.24), которые 
можно считать некоторыми т-шаговыми аппроксимациями за- 
дачи Коши (16.6). 
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16.4. УСТОЙЧИВОСТЬ И НЕУСТОЙЧИВОСТЬ 
НЕКОТОРЫХ ПРОСТЕИШИХ РАЗНОСТНЫХ 
СХЕМ 


Изучение устойчивости численных методов решения на- 

чальных задач (16.6) обычно проводят на простом уравнении вида 
' 

У РУ, (16.31) 

называемом в данном случае модельным уравнением; будем по- 


* 
ка считать здесь р вещественным параметром). Его общее ре- 
шение есть 
у а”, 

и решение соответствующей ему задачи Коши с начальным ус- 
ловием у(ху)= уу — функция 

у= удеР №) (16.32) 
— стремится к нулю, если р<0, и бесконечно растет по абсо- 
лютной величине при р > 0. Посмотрим, как ведут себя ошибки 


простейших численных методов, примененных к модельному 
уравнению (16.31). 


Метод Эйлера (16.11) на модельном уравнении (16.31) (с 
Л(х, у) = ру и Лу(х, у) = р) допускает ошибку, которая, соглас- 
но (16.19), (16.20), удовлетворяет рекуррентному равенству (ина- 
че, разностному уравнению) 


61 = + рй)б; +О(й?), (16.33) 


где 1=0,1,2,й и до =0. Второе слагаемое в (16.33) связано с 
погрешностью аппроксимации данного дифференциального 
уравнения (16.31) разностной схемой 


Уна = У; + ЙРУ,, (16.34) 


и его влиянием на численную устойчивость процесса (16.34) мож- 
но пренебречь (правда, считать его постоянным, т.е. не зависящим 
от 7, можно лишь условно). Характеристическое уравнение (16.27) 
для (16.33) при т =1 имеет единственный простой корень 


Я=1+рй, 
определяющий фундаментальное решение 
д; =(1+ р)! 


* 

) Впоследствии (см. $ 16.7) условие ре ® будет заменено услови- 
ем РЕС, и несколько прояснится смысл рассмотрения моделей именно 
вида (16.31). 


соответствующего однородного уравнения. Частным решением 
уравнения (16.33), согласно форме (16.29), можно считать 


5__ О 


1 


?) 
= =О(Ю. 
1-(+ рй) 


Следовательно, представление ошибки, накопленной к (1+1)-му 
шагу реализации (16.34) метода Эйлера (16.11), имеет вид 


6, =С(1+ рй)' + О(®), (16.35) 


где С=бу-О(Й), а под бо может пониматься либо нуль при 
точном стартовом значении уд = у(хо), либо небольшая ошибка 
приближенного ввода уд = у(хо). 

Анализируя поведение ошибки (16.35) при 1-> +®, видим, 


что ее рост будет ограниченным, если шаг сетки Й будет удовле- 
творять неравенству 


[1+ РИ <1. (16.36) 
Ясно, что при положительных р это неравенство не может быть 
выполнено ни при каких й>0; действительно, если решение 
растет по абсолютной величине (см. (16.32)), то и погрешность 


получаемого методом Эйлера приближенного решения неизбеж- 
но растет. При отрицательных р неравенство (16.36) равносиль- 


2 Е 
но условию 0<й<-—, т.е. допустим любой шаг из промежут- 
Р 


ка [о -2| 
Р 


Таким образом, метод Эйлера (16.11) устойчив на модель- 
ном уравнении (16.31), если в этом уравнении р < 0 и расчетный 


2 ы 
шаг метода й <-—. Это ограничение на шаг относит явный ме- 
Р 
тод Эйлера к условно устойчивым методам. 


Неявный метод Эйлера (16.12) имеет ошибку, которая в 
соответствии с (16.22) удовлетворяет разностному уравнению 
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Решение этого уравнения, согласно (16.30) с учетом того, что 


Я,= ‚› можно записать так: 
1- рй 
| 2 р 
с 0) -с( | } +0. 
а-1-— 1-рй 
1- рй 


Отсюда видно, что для невозрастания ошибки д; с ростом 1 нуж- 
но потребовать выполнения неравенства 


| 
<1 
|-РЯ 
что при рй = 1 равносильно неравенству 
И РИ >1. (16.37) 
Для отрицательных р это неравенство выполняется при любых 


) 


2 ы я * 
й > 0, т.е. неявный метод Эйлера абсолютно устойчив ). Если 
же р > 0, то в таком случае равносильным (16.37) является нера- 


венство рй>2, т.е. рост погрешности будет заведомо ограни- 
ченным при условии, что расчетный шаг не слишком мал, а 


2 
именно, при й > —. 
Р 


Уточненный метод Эйлера (16.13), приложенный к мо- 
дельному уравнению (16.31), задается однородным трехточеч- 
ным разностным уравнением второго порядка 

Унл= 2 рйу; + У;-1ь (16.38) 


а ошибка д;, накапливаемая этим методом к 7-му шагу, согласно 
(16.23), удовлетворяет неоднородному уравнению 


б.1=2рй6; +6, 1+0(®3). (16.39) 
Составив характеристическое уравнение вида (16.27) при т=2 
А? =2рйл +1 


и найдя его корни 


Я = РАНА Р? и ДЕЛЬ, 


* 
) Заметим, что понятия абсолютной и условной устойчивости чис- 
ленных процессов решения задач Коши обычно вводят применительно к 
асимитотически устойчивым решениям, т.е. для случая р<0 [158]. 
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видим, что #1 >1 при р>0, а 1) <-1 при р<0. Значит, соот- 
ветствующее записи (16.30) общее решение уравнения (16.39) 

5: =С +65 +0?) 
с ростом 7 будет расти по абсолютной величине при любых ри 
й вне зависимости от начальных условий, определяющих нену- 
левые постоянные С] и С.. 

Таким образом, умочненный метод Эйлера (16.13), обладая 
более высоким порядком аппроксимации, чем явный или неяв- 
ный методы Эйлера, является неустойчивым методом. 

Попытаемся понять природу такой неустойчивости метода 
(16.13). 

Сравнивая уравнение (16.38) для каркаса решения и урав- 


нение (16.39) для его ошибки, приходим к выводу, что они име- 
ют одни и те же фундаментальные решения 


: 1 х 7 
Я = [А пиот и = ый +2? ; 
1 
2 
Применив к ( - (рп)?) биномиальное разложение и увидев в 
результате такого разложения несколько первых членов ряда для 


экспоненты, при малых ри имеем: 


д ро +о(рю ]] 5 (=, (1640) 


№ = 28-1 - (ри ору =(-е-*)' = (-1)1е-#* (16.41) 


Если теперь рассмотреть точное решение (16.32) модельно- 
го уравнения (16.31) на сетке 


хо =0, Хх; =, 


а точнее, фундаментальное решение У(х)=е”” линейного урав- 
нения (16.31), то оказывается, что сеточное фундаментальное 
решение описывается равенством 

У(х;) = ей", (16.42) 
т.е. совпадает с приближенным представлением одного из 
фундаментальных решений разностного уравнения (16.38). 

Итак, трехточечное разностное уравнение (16.38), являясь 
уравнением второго порядка, имеет два фундаментальных реше- 
ния: (16.40) и (16.41), одно из которых является паразитным. 
При р отрицательных, когда точное решение (16.42) убывает, за 
счет паразитного фундаментального решения (16.41) происходит 
рост приближенного решения у;. Если же р положительно, то 
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ошибка д;, как уже выяснилось, растет, но поскольку в этом слу- 
чае растет и решение, рост ошибки не страшен (паразитное фун- 
даментальное решение (16.41) при этом затухает, что влечет 
убывание относительной погрешности приближенного решения). 

Возвращаясь к общему случаю уравнения у’ = Х(х, у), от- 
метим, что в роли параметра р в приведенных и в аналогичных 


им исследованиях численной устойчивости методов, согласно 
(16.20), (16.22) и т.п., должны фигурировать значения функции 
Х,(х, у). Если можно считать, что },(х, у) = сопз!, то допусти- 


мо использование (кусочно-) постоянных аппроксимаций У и 


применение фактов теории линейных разностных уравнений с 
постоянными коэффициентами. В противном случае требу- 
ется привлечение более тонких результатов о решениях линейных 
разностных уравнений с переменными коэффициентами. 


16.5. ИССЛЕДОВАНИЕ УСТОЙЧИВОСТИ 
МНОГОШАГОВЫХ МЕТОДОВ 


Будем теперь рассматривать на предмет устойчивости 
(2т+1)-параметрическое семейство линейных т-шаговых мето- 
дов вида 


т, т, 
у = Фалунь +1. Ван Ув] (16.43) 
9+ 7=0 


(см. (15.35)) в предположении, что выполняются условия согла- 
сованности (15.37), (15.39) его коэффициентов @; (1=1,2,й ‚,т) 
и 2; (=0,1,й ‚, т), необходимые и достаточные для обеспече- 
ния, как минимум, первого порядка точности метода (16.43). Да- 
же на модельном уравнении (16.31) сложно проанализировать 
накопление погрешностей в численном процессе (16.43) так, как 
это делалось для простейших разностных схем. Поэтому к иссле- 
дованию устойчивости многошаговых методов часто применяют 
упрощенный подход, предложенный в 50-х годах ХХ века швед- 
ским математиком Дальквистом. Суть подхода состоит в том, 
что нелинейное разностное уравнение (16.43), аппроксимирую- 
щее данное дифференциальное уравнение (16.6), в свою очередь, 
аппроксимируется однородным линейным разностным уравне- 
нием с постоянными коэффициентами 
т 
Им = ханы) . (16.44) 
= 
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Оно получается отбрасыванием в уравнении (16.43) второго сла- 
гаемого из тех соображений, что сходимость метода (а значит, и 
поведение каркаса решения, поведение ошибки) изучается при 
й->0; наличие множителя И во втором слагаемом позволяет 
допустить, что оно играет ограниченную роль, если функция Х 
ограничена. 

В соответствии с изложенным в двух предыдущих парагра- 
фах, поведение решений 7; разностного уравнения (16.44) и его 
аппроксимационные свойства по отношению к данному диффе- 
ренциальному уравнению тесно связаны с величинами корней 
характеристического уравнения 


"ой" -й а, А-а, =0, (16.45) 


через которые выражаются фундаментальные решения уравне- 
ния (16.44) и аналогичного ему уравнения для ошибок. 


Определение 16.4. Метод (16.43) при выполнении ус- 
ловий согласованности (15.37), (15.39) называется устой- 
чивым по Дальквисту, если все корни характеристическо- 
го уравнения (16.45) по модулю не превосходят единицы и 


Ез 
среди корней Л; таких, что |йу|=1, нет кратных ). Если, 
кроме того, т-1 корней уравнения (16.45) по модулю мень- 
ше единицы, то метод (16.43) называется строго устой- 
чивым [138] или сильно устойчивым [6, 10]. 


Чтобы осмыслить определение устойчивости по Дальквисту, 
достаточно вспомнить, что приближенное выражение ошибки д; 
метода (16.43) представляется линейной комбинацией фундамен- 
тальных решений 6, (7=1,2,й , т) разностного уравнения 


т 
ды = аду, 

р 
и чтобы не наблюдалось роста ошибки, требуется ограничить 
единицей корни характеристического уравнения (16.45), через 
степени которых выражаются фундаментальные решения д. 
При этом нельзя допустить наличия кратных корней с моду- 
лями, равными единице, ибо в противном случае неизбежен рост 


ошибки при 7—0 из-за наличия в представлении 6; слагаемых 


с модулями, пропорциональными 1, в : УТ, где К — показа- 


тель кратности корня. Строгая же устойчивость означает, что в 


* 
) В [158] это требование называют условием корней, в [3, 188] — 
корневым условием, ав [12] — условием &. 
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представлении решения У, однородного разностного уравнения 
(16.44) через фундаментальные решения У, (1=1,2,й ‚п) лишь 


одно слагаемое должно аппроксимировать решение дифферен- 
циального уравнения (16.6), а остальные слагаемые должны стре- 
миться к нулю, т.е. паразитные фундаментальные решения 
должны быть затухающими. 

Поскольку данное определение устойчивости не учитывает 
второе слагаемое в формуле (16.43), с его помощью можно де- 
лать лишь грубую отбраковку неустойчивых методов. 


Применим определение 16.4 к нескольким изучавшимся ра- 
нее методам. 


Явный и неявный методы Эйлера (16.11), (16.12) имеют 
характеристическое уравнение Д-1=0 с единственным корнем 
Я 1 = 1; следовательно они строго устойчивы по Дальквисту (как, 


кстати, и любой другой одношаговый метод, рассматриваемый в 
качестве частного случая т-шаговых методов). 
Уточненный метод Эйлера (16.13) является двухшаговым 


методом с характеристическим уравнением в =0; наличие 
двух простых корней Л › =+1 говорит об устойчивости этого 


метода по Дальквисту, но не строгой устойчивости (сравните с 
более детальным изучением его устойчивости, точнее сказать, 
неустойчивости, в предыдущем параграфе). 


Метод Адамса (явный или неявный) 
т. 
Ун=У, +Й>, В,Л(кн, Уна) 
/=0 


строго устойчив по Дальквисту при любом те М, так как его ха- 


рактеристическое уравнение А” - 1”! =0 имеет один корень, 
равный единице, а остальные т -1 корней равны нулю. 
То же можно сказать и о методе Коуэлла (15.47). 


Метод Милна четвертого порядка, как известно, опреде- 
ляется двумя формулами: 


прогноза (15.28) 

я 4й 

У:+1 = У;-3 + 3 @л -214+2й.5) 
и коррекции (15.31) 


й ^ 
Ут = У + зы +4Д + Г 
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Первая из этих формул является четырехшаговой с характери- 
стическим уравнением и =0, корни которого Я12 =1, 
Я 3,4 = 1, а вторая — двухшаговой, для которой соответственно 


имеем 12 —1= 0, Й1. > = +1. Как видим, та и другая формулы оп- 
ределяют разностный метод, устойчивый по Дальквисту, но не 
строго устойчивый. Таким образом, метод Милна четвертого по- 
рядка, несколько выигрывая у метода прогноза и коррекции 
(15.22), построенного на основе методов Адамса того же поряд- 
ка, по точностной характеристике (что отмечалось в конце 
$ 15.3), проигрывает последнему по устойчивости. 

Требование устойчивости по Дальквисту должно учиты- 
ваться при конструировании конкретных методов из семейства 
(16.43). Это означает, что при подборе параметров в формуле 
(16.43) следует заботиться не только о том, чтобы она аппрокси- 
мировала данное дифференциальное уравнение как можно точ- 
нее, но и чтобы соответствующее этой формуле алгебраическое 
уравнение (16.45) имело ограниченные единицей модули корней 
и не допускались кратные корни с модулями, равными единице. 

Априори 2т-1 коэффициентов &,, В; в методе (16.43) 


можно подобрать так, чтобы находимые с его помощью прибли- 
жения у; аппроксимировали значения решения у(х;) задачи 
(16.6) с порядком 2т, т.е. чтобы этот метод был точен для мно- 
гочленов степени 2т (такие примеры можно найти в $ 15.4). Од- 
нако доказано, что построенные на этой основе методы наивыс- 
шего алгебраического порядка точности являются заведомо 
неустойчивыми. Этот факт уточняется следующим утверждени- 
ем [12]. 


Теорема 16.1. Пусть 5 -— порядок аппроксимации 
т-шаговым разностным методом (16.43) задачи (16.6). То- 
гда в каждом из следующих случаев: 

а) метод явный (Ву =0) иб>т; 

6) метод неявный (Ву =0), т — нечетное и 5>т+1; 

в) метод неявный (Ву * 0), т — четное и 5>т+2 
среди корней Л ; характеристического уравнения (16.45) 


найдется корень, по модулю больший единицы. 


16.6. ЖЕСТКИЕ УРАВНЕНИЯ И СИСТЕМЫ 


Имеются задачи, для которых вопрос об устойчивости или 
неустойчивости применяемых численных методов стоит наибо- 
лее остро и требует большой дифференциации. Речь идет о на- 
чальных задачах для дифференциальных уравнений, называемых 
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жесткими. Такие задачи, возникающие в самых разных приклад- 
ных областях, в последние десятилетия являются объектом по- 
вышенного внимания специалистов по вычислительной матема- 
тике и служат тем оселком, на котором оттачиваются понятия, 
формулировки, методы, алгоритмы, программы. 

В литературе можно встретить несколько определений же- 
сткости, отличающихся разным уровнем строгости. При первом 
знакомстве более важно понять, в чем состоит проблема при 
численном интегрировании дифференциальных уравнений, вы- 
деляющая какие-то из них в разряд жестких, и как ведут себя те 
или иные методы на таких задачах. 

Приведем цитату из посвященной жестким уравнениям мо- 
нографии К. Деккера и Я. Вервера [60]: «Сущность явления же- 
сткости состоит в том, что решение, которое нужно вычис- 
лить, меняется медленно, однако существуют быстро 
затухающие возмущения. Наличие таких возмущений затрудня- 
ет получение медленно меняющегося решения численным спосо- 
бом». Попытаемся получить некоторые представления об этом 
явлении с помощью следующих двух примеров [138]. 


Пример 16.1. Точным решением задачи Коши 


У =-100у+100, 


2 (16.46) 


является функция 
= —100х 
у=1+е 100, (16.47) 


которая уже при малых положительных х становится близкой к своему 
предельному значению у=1. Это означает, что для получения численного 
решения на достаточно большом промежутке [0,6] естественно с мелким 
шагом построить решение в его переходной фазе (в правой окрестности 
нуля, т.е. там, где оно быстро меняется), а затем продолжить численный 
процесс с крупным шагом в области малых изменений решения. 

Посмотрим, на что можно рассчитывать, применяя к задаче (16.46) 
(отличающейся от модельной задачи (16.31) лишь наличием свободного 
члена) простейшие разностные схемы, устойчивость которых изучалась 
в $ 16.4. 

Расчетная формула условно устойчивого метода Эйлера (16.11) для 
(16.46) имеет вид 


Ут = (1-100й)у; +100; 1=0,.й; У=2. (16.48) 


В соответствии с условием устойчивости (16.36) расхождение между у; и 
У(х;) не будет расти, если расчетный шаг удовлетворяет неравенству 
| 1001 < 1, т.е. если й< 0.02. Взяв й= 0.02, из (16.48) получаем числен- 
ный процесс 


Ун=2-у; 1=0,й; У=2, 
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порождающий последовательность 


У(0) = ур =2, (0.02) = у =0, у(0.04) = ур =2, (0.06) = уз =0,й 
Как видим, решение разностного уравнения получается ограниченным, но 
нельзя считать, что оно удовлетворительно приближает решение (16.47) 
задачи (16.46) (имеет место «четно-нечетная болтанка» [9]). При й= 0.01 
(это середина допустимого для Й интервала устойчивости (0,0.02)) про- 
цесс (16.48) приобретает вид 


5=2, Ушм=т У! №, 


показывающий, что первая же вычисляемая точка у| (= у(0.01)) попадает 


на асимптоту решения (16.47), и последующие вычисления не изменяют 
значений приближенного решения. Несмотря на устойчивость этого чис- 
ленного процесса и стремящуюся к нулю ошибку при 7 —> © ‚, он совсем не 
описывает переходный процесс. Существенно более мелкий шаг, напри- 
мер, й= 0.001 вполне удовлетворительно характеризует начальное изме- 
нение решения, что видно из получающейся при этом последовательности 


ж%=2, (0.001) = м =1.9, У(0.002)= у> =1.81, В, 


но потребует больших вычислительных затрат (и, как следствие, повлечет 
накопление ошибок округлений) при построении приближенного решения 
на промежутке, достаточно большом по сравнению с величиной шага Й. 

Применение здесь абсолютно устойчивого неявного метода Эйлера 
(16.12) означает проведение вычислений по формуле 


100+ у; . 
1+100й ’ 


Полагая здесь для удобства счета й=0.09, получаем следующую 
последовательность приближенных ординат решения (16.47): 


У0=2, (0.09) = я =1.1, (0.18) = у› =1.01, (0.27) = уз =1.001,й. 


Даже при очень крупном шаге й = 0.99 определяемая посредством (16.49) 
последовательность 


ж=2, и=1.01, уз =1.0001,й 


качественно верно определяет поведение решения (16.47) задачи (16.46). 
Так что для получения приближенного решения данной задачи неявным 
методом Эйлера с нужной точностью при выборе расчетного шага й дос- 
таточно позаботиться лишь об адекватной точности аппроксимации диф- 
ференциального уравнения разностным. 

Неустойчивая разностная схема (16.13), иначе, уточненный метод 
Эйлера, в данном примере приобретает вид 


Ул = У-1- 200йу; +200й; 1=12,й , (16.50) 
где, кроме известной начальной точки уд = у(0)=2, требуется задание 


еще одной точки у. Положим Й= 0.01 и, соответственно, за у примем 
значение 


= 1=0,1й; М=2. (16.49) 


х =1.37 ( Иод =1+1). 
е 


606 


В таком случае вычисления по рекуррентной формуле (16.50) продолжают 
эту последовательность следующим образом: 


у› =1.26, уз =0.85, уд =1.56, уз =-0.27, у =4.10,й. 


Не вызывает сомнений ее непригодность для приближенного описания 
поведения решения (16.47). Взяв в 100 раз меньший шаг й = 0.0001, при 
котором погрешность аппроксимации дифференциальной задачи (16.46) 
дискретной задачей (16.50), согласно (16.9), есть 00-3), для тех же на- 
чальных элементов последовательности уд =2 и у =1.37 имеем продол- 
жение 


у =1.993, уз =1.350, уд =1.986, уз =1.330, 
Уб =1.979, ул =1.311, уз =1.973,й. 


Пульсирующий характер последовательностей с достаточно большими 
амплитудами пульсаций может быть объяснен поведением паразитной со- 
ставляющей решения разностного уравнения (16.50), о чем говорилось 
при анализе причин неустойчивости уточненного метода Эйлера в $ 16.4. 


Пример 16.2. Уравнение второго порядка 
у" +101у' +100у=0 (16.51) 
с начальными условиями 
У(0)=1.01, у(0)=-2 
имеет решением функцию 
5(х) = 0.011605 +е-х. (16.52) 
Первое из слагаемых, составляющих эту функцию, является быстро- 
затухающим, а второе изменяется сравнительно плавно; проследить за по- 
ведением этих двух слагаемых на промежутке [0, 0.1] можно по следую- 
щей таблице их приближенных значений: 


ПЕ ВЕЕТ ПЕРЕРИ 


ОВО ГС 1 НИ 
0.0000т |0.009999 0.99999 


Го.000т_ 0.0099 10.9999 | 
[0.001 10.0091 0.999 _ 
[0.07т__10.004 ___ 10 
[0.1 _10.0000004__109 | 


Очевидно, за пределами промежутка [0, 0.1], характеризующего переход- 
ную фазу, вклад первого слагаемого У в решение (16.52) задачи (16.51) 
ничтожен. Это означает, что при последовательном получении прибли- 
женных численных значений решения у(х) промежуток [0,0.1] нужно 
проходить с маленьким шагом, а затем, чтобы уменьшить вычислитель- 
ные затраты и погрешность округлений, расчетный шаг должен быть уве- 
личен. Всякие ли вычислительные методы позволяют произвести укруп- 
нение шага после построения приближенного решения в переходной фазе? 
Ответ на этот вопрос будет отрицательным. 
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Действительно, как отмечалось в $ 15.6, для построения численного 
решения задачи (16.51) формально можно применять разные численные 
методы решения задачи Коши для уравнений первого порядка в векторной 
форме, сведя ее к системе 

ыы 5(0)=1.01, 
2'=-100у-1012, 2(0)=-2. 


Использование здесь условно устойчивых явных методов, например, та- 
ких как метод Эйлера, накладывает ограничение на величину шага, обу- 
словленное как раз необходимостью устойчивой аппроксимации быстро- 
затухающей составляющей решения. 


(16.53) 


Вообще, переход к системе дифференциальных урав- 
нений позволяет взглянуть на проблему жесткости с несколько 
иных позиций. 

Пусть и-мерная система 

х = Ах (16.54) 
имеет асимптотически устойчивое решение 


х(е) = с ((),п ‚хи (0). 
Если его компоненты, т.е. функции х1(!),й ‚х„(Г), существенно 
различаются по скорости своего изменения на промежутке 
[0 Т|, на котором решается задача Коши для (16.54), то приме- 
нение здесь условно устойчивых численных процессов требует 
интегрирования с таким малым шагом, какой обеспечивает ус- 
тойчивое вычисление самой быстрозатухающей компоненты 
(ведь шаг й — величина скалярная, общая для всех компонент). 
Следовательно, жесткость системы дифференциальных уравне- 
ний зависит от того, насколько сильно разнится поведение ком- 
понент вектора-решения при условии его асимптотической ус- 
тойчивости. В свою очередь, в случае постоянной матрицы А в 
системе (16.54) это различие в скорости изменения функций 
х1 (0), й , х„(Г) связано с тем, насколько сильно различаются 


собственные числа 11, й , Й„ матрицы А. Обоснование такой 


связи можно найти, например, в [6, 158]; возвращаясь же к при- 
меру 16.2 и найдя собственные числа 11 =-100, Д› =-1 матри- 


—100 —101 
мере, в рациональности такого суждения. 
Отсюда приходим к следующему определению жесткой 
системы [158]. 


0 1 
цы А-[ системы (16.53), убеждаемся, по крайней 
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Определение 16.5. Система (16.54) с постоянной 
пхп-матрицей А называется жесткой, если собственные 
числа Ар (К=12,й ‚п) матрицы А удовлетворяют сле- 


дующим условиям: 
1) Вей» <0 УКЕй,2,й ‚п}; 
тах{|Ве Хх |} 
2) Число жесткости © =——_—_—_ велико. 
ши Ве Хи |} 


Нестрогость, заключенная в последнем слове данного опре- 
деления, сродни той, которая присутствует при введении поня- 
тия «плохая обусловленность матрицы» (см. гл. 1); избавиться от 
нее можно, лишь рассматривая конкретную задачу. 

В случае линейной системы с переменными коэффи- 
циентами, т.е. при А =А\((Г) в (16.54), собственные числа Ду и, 
соответственно, число жесткости © являются функциями от [, и 
определение 16.5 жесткой системы может быть переформулиро- 
вано следующим образом. 


Определение 16.6. Система 
х=А(1)х, #>0 
называется жесткой на интервале (0,Т), если при всех 
ГЕ (0, Т) 
Кей, (1)<0 УЁЕЦ,2,й ,п} 
и число зир (г) велико. 
1=(0, Г) 
В основе определения жесткости нелинейной системы 
х=Е(х, Г) 

лежит определение (16.6), роль матрицы А(г) в котором отво- 


1 с ; 
дится матрице частных производных г (К 7=12,й ‚п), где / 
Хх . 


и х; — компоненты вектор-функций Е и х соответственно. 

Заметим, что требование асимптотической устойчивости 
точного решения системы дифференциальных уравнений, обес- 
печивающееся выполнением первого условия приведенных оп- 
ределений жесткости, иногда заменяют более слабым условием 
асимптотической устойчивости не всех, а только быстрозату- 
хающих компонент вектора-решения, что расширяет класс жест- 
ких систем. С другой стороны, промежуток, на котором дейст- 
вуют быстрозатухающие возмущения, часто не относят к 
промежутку жесткости [60] (например, в примере 16.1 таковым 
является промежуток [0, 0.1]). 
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16.7. А- И А(@)-УСТОЙЧИВОСТЬ. 
ЧИСТО НЕЯВНЫЕ МЕТОДЫ 


Как следует из материала предыдущего параграфа, жесткие 
уравнения предъявляют жесткие требования к устойчивости 
численных методов, применяемых для их решения. А именно, 
при получении асимптотически устойчивого решения жесткой 
задачи Коши ошибка разностного метода не должна расти при 
любом шаге, т.е. метод должен быть безусловно устойчивым. 
Чтобы оформить сказанное более четко, дадим сначала опреде- 
ление области устойчивости [158]. 


Определение 16.7. Областью устойчивости разно- 
стного метода (16.43) решения начальной задачи (16.6) на- 
зывается множество всех точек комплексной плоскости, 
определяемой комплексной переменной и= рй, для кото- 


рых этот метод, примененный к модельному уравнению 
(16.31), устойчив, т.е. обеспечивает невозрастание ошибки. 


Теперь сформулируем определение устойчивости метода, 
ориентированное на применение к жестким задачам. 


Определение 16.8. Разностный метод (16.43) называ- 
ется А-устойчивым, если его область устойчивости со- 
держит левую полуплоскость комплексной плоскости, оп- 
ределяемой переменной и = ри. 


Обращаясь к простейшим разностным схемам, сразу отме- 
тим, что об А-устойчивости явного метода Эйлера (16.11) не 
может быть и речи. Действительно, согласно проведенным в 
$ 16.4 исследованиям, для невозрастания ошибки этого метода 
требуется выполнение неравенства (см. (16.36)) 


[4+1 <1, 


что реализуется в круге радиуса 1 с центром в точке (-1; 0) ком- 
плексной плоскости с осями Ои и Оу» (рис. 16.2а), где 


и = Вед = Ве(рй), у=1пи= Ит(рй). 


Этим неравенством задается его область устойчивости, состав- 

ляющая лишь малую часть левой полуплоскости плоскости Оиу. 
Устойчивость неявного метода Эйлера (16.12), в соответст- 

вии с неравенством (16.37), связана с выполнением неравенства 


[4-1 >1, 
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которое определяет на комплексной плоскости Оиу внешнюю 
часть такого же круга, но круг этот расположен в правой полу- 
плоскости (рис. 16.26). Как видим, область устойчивости неявно- 
го метода Эйлера целиком содержит левую полуплоскость; сле- 
довательно, неявный метод Эйлера А-устойчив. 


С 


7) 


Рис. 16.2. Области устойчивости явного (а) и неявного (6) методов Эйлера 


Рассмотрим на предмет А-устойчивости метод трапеций 
(14.15) (он же — метод Адамса-Моултона второго порядка (15.19)). 
На модельном уравнении (16.31) его расчетная формула имеет вид 


ри 
А (16.55) 
2 
Те или другие источники получения разностной схемы (16.55) 
позволяют считать, что подстановка в нее точного значения 


у(х;) вместо у; сопровождается ошибкой О(и? ), т.е. имеет место 
равенство 


убил) = об) + бед + бин) +08) 


Вычитая равенство (16.55) из последнего равенства, приходим к 
следующему двухточечному разностному уравнению первого 
порядка относительно ошибки д; := у(х;)— ух: 


) р 
( ры ы | + +0(3) 


Отсюда видим, что невозрастание ошибки 6; гарантируется при 
выполнении неравенства 


2+ рй 
2—рй 


|= 
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Полагая здесь д = ри=и+®, и=2, имеем 
2Р-+и+м<р2-и-м < У (и)? +? <У(2—и)? +2 


> и<0 <> КВеи<0. 


Таким образом, область устойчивости метода трапеций точно 
совпадает с левой полуплоскостью комплексной плоскости чисел 
д = рй; следовательно, метод трапеций А-устойчив. 


Докажем также А-устойчивость неявного двухшагового 
разностного метода второго порядка (16.15), выведенного 
в$ 16.2. 


Аналогично предыдущему, легко получаем разностное 
уравнение для ошибки каркаса решения модельного уравне- 
ния (16.31). Оно имеет вид 

(3-26 -46;+6,1+0(3)=0. 


Его характеристическое уравнение 


(3—24)42 -44+1=0 (16.56) 
имеет корнями числа 
2+\/1+2 
тэ — й 
3—2 


непосредственное оценивание которых, точнее, построение об- 
ласти, содержащей только те точки, при которых | >| <1, вы- 
зывает определенные затруднения. Изберем другой путь [158]. 
Попытаемся выяснить вид границы области устойчиво- 
сти, рассматривая равенство (16.56) при таких комплексных #4, 
модуль которых равен единице. При этом будем пользоваться 
как тригонометрической, так и показательной формами ком- 
плексного числа, т.е. тем, что при || =1 по формуле Эйлера 


Д=с0зф+1зтф=е?. (16.57) 


Выражая из (16.56) текущую комплексную переменную д, с 
помощью равенства (16.57) получаем: 


— 42,3 = 1-2 — 2е 9 = 


= 0520-5520 20050+ 211+ =и+М, 
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где 


и -20050+5.60520 = (1-с059} 20, (6.58) 


у=25тр — т5т2р = (2 — 6050). (16.59) 


Найденные выражения и и у текущей точки д границы об- 
ласти устойчивости можно рассматривать как ее параметриче- 
ские уравнения, в которых параметром служит полярный угол ф. 
Из (16.58) сразу видно, что граница находится в правой полу- 
плоскости, а исследуя определенную в (16.59) функцию у на 
экстремум, выясняем, что существуют два значения параметра 


1+3 


ф.о = агссо$ ‚ которым соответствуют экстремальные зна- 


чения у= +2 при и=1.85. Найдя еще дополнительно две харак- 
терные точки границы (0;0) и (4;0), схематично изображаем 
замкнутую линию, определяемую параметрическими уравнения- 
ми (16.58), (16.59) (рис. 16.3). Эта линия делит всю комплексную 
плоскость на две области: в одной из них модули корней уравне- 
ния (16.56) меньше единицы, в другой — хотя бы один из корней 


1 
больше единицы. Подставив в (16.56), например, т полу- 


чаем уравнение 42 -44+1=0 с корнями #12 и Следова- 


тельно, область устойчивости метода (16.15) лежит за пределами 
построенной замкнутой линии и содержит левую полуплоскость. 


Рис. 16.3. Область устойчивости разностной схемы 


4 1 2й 
У =371-57ы +—У@нь Уш) 


т 
э 
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К сожалению, класс А-устойчивых методов весьма узок. 
Доказано, что среди линейных многошаговых методов (16.43) 
нет явных А-устойчивых методов, а порядок неявных А- 
устойчивых методов этого семейства (16.43) не может быть 
больше двух. 

В связи с этим представляют интерес формулировки опре- 
делений более слабой устойчивости, которые расширяли бы 
множество разностных методов, хотя бы ограниченно пригодных 
для численного решения жестких задач. 

Прямым обобщением А-устойчивости является А(@)- 
устойчивость. 


Определение 16.9. Разностный метод (16.43) называ- 


№ п 
ется А(а)-устойчивым, если существует угол а« [07 


такой, что область устойчивости метода (рис. 16.4) со- 
держит сектор комплексной плоскости переменных 
д = ри, определяемый неравенством 


| аго (- 4] <<. 


Рис. 16.4. Изображение области (заитрихована), которая должна 
содержаться в области устойчивости А(»)-устойчивого метода 
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М п ф 
Очевидно, что А-устойчивость — это А 5 -УСТОИЧИВОСТЬ. 


А(<)-устойчивые методы можно найти в подсемействе се- 
мейства т-шаговых разностных методов (16.43), определяемом 
формулой 


т 

Фауна = ИО Уч. (16.60) 

1=0 
Счет по формулам вида (16.60) не использует значений произ- 
водных решения в предыдущих узлах, и поэтому такие методы 
называют чисто неявными методами. Источником получения 
конкретных А(&)-устойчивых чисто неявных методов вида 


(16.60) служит применение к аппроксимации производной в ра- 
венстве 


У@н = ЛОнь Уно (16.61) 


формул дифференцирования назад”), т.е. несимметричных фор- 
мул, аппроксимирующих у’(х;.1) с разным порядком точности с 
помощью значений у; 1, У;, Ут ит.д. 

Так, аппроксимация у’(х;,1) в (16.61) разностными отно- 
шениями 


1 1 
Он -У) и ор ЗУ -Чу +1) 


а С 
приводит к изученным нами 4 устойчивым чисто неявным 


методам первого (16.12) и второго (16.15) порядков. Аналогично, 
аппроксимация у’(х;.1) по формулам, например, третьего и чет- 
вертого порядков приводит к чисто неявным методам 

Пу;т -18у; +9у;-1 - 2у;—2 = 61, Уч (16.62) 
и 


25у;+1 — 48у; + 36у; 1 —16у;-2 +Зу;-3 = 12 Она, Уи), а6.63) 
которые, как доказано, являются А(@)-устойчивыми с 


&=1.544 рад (: 88°) для метода третьего порядка (16.62) и с 


а = аки \6 =1.278 рад (: 68°) для метода четвертого порядка 
(16.63) [158]. С повышением порядка метода дифференцирова- 


* 

) В связи с чем и выводимые таким образом методы численного 
решения задач Коши часто называют методами дифференцирования 
назад [188]. 
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ния назад значения угла х уменьшаются, и при порядке выше 
шестого А()-устойчивых методов среди семейства многошаго- 
вых методов (16.60) не обнаруживается ни для каких & > 0 [185]. 

Заметим, что при применении чисто неявных методов к 
численному интегрированию жестких задач соответствующие 
используемому методу разностные уравнения, в общем случае 
нелинейные относительно очередного значения у;,|, должны 


решаться достаточно точно. Здесь рекомендуется привлекать 
быстросходящиеся итерационные методы типа метода Ньютона 
(см. гл. 5—7, а также [6, 188]). 


Вернемся к началу этого параграфа и посмотрим, что озна- 
чают А-и 4(@)-устойчивость разностных методов, применяе- 
мых именно к жестким системам дифференциальных уравне- 
ний. 

Если некоторый метод А-устойчив, то он пригоден для 
формального нахождения приближенного решения модельного 
уравнения у’=ру с любым шагом й>0 при любых комплекс- 
ных р с отрицательными вещественными частями, а это в свете 
наблюдений предыдущего параграфа означает, что шаг й может 
быть подобран так, чтобы система (16.54) решалась устойчиво 
при любом разбросе собственных значений ее матрицы А, т.е. 
практически при любой величине числа жесткости ©. Если же 


ь л 
метод А(а)-устойчив с @ < Гь то допустимость этого метода для 


решения системы (16.54) можно связать с тем, вписываются ли 
собственные числа Й) ее матрицы, а точнее, величины Я й, в 


определяемый данным @ сектор комплексной плоскости 
(см. определение 16.9). 


УПРАЖНЕНИЯ 


16.1. Оцените сверху величину | у(1)- у» |, где у(Г) — точное ре- 
шение задачи 
у’ =э(ху), 20)=0 
в точке х=Т, а у, — приближение к нему, полученное методом Эйлера с 


1 
шагом й=-. 
п 


16.2. Продолжите серию разностных схем (16.11)—(16.15), исполь- 
зуя формулы численного дифференцирования третьего порядка точности. 
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16.3. Исследуйте на устойчивость по Дальквисту: 


а) явный и неявный двухшаговые разностные методы второго по- 
рядка (16.14) и (16.15); 

6) явный двухшаговый метод третьего порядка (15.46); 

в) явный и неявный методы, выведенные при выполнении упр.15.3. 


16.4. Исследуйте на модельном уравнении у’= ру поведение 
ошибки метода Адамса-Башфорта второго порядка (15.12). Что можно 
сказать о его устойчивости? 


16.5. Проанализируйте выражения корней характеристического 
уравнения для однопараметрического семейства двухшаговых методов 
третьего порядка (15.45), выделите из этого семейства наиболее устойчи- 
вый по Дальквисту метод. Встречался ли этот метод ранее? Как он назы- 
вается? 


16.6. Убедитесь, что А(ам)-устойчивый чисто неявный метод 
третьего порядка (16.62) является строго устойчивым по Дальквисту. 


16.7. При каком ограничении на шаг можно рассчитывать на ус- 
тойчивое решение задачи 


х=-Их+у, х(0)=0, 
У=-7х-3Зу, У(0)=0 


методом Эйлера? 


16.8. Не находя области устойчивости чисто неявного метода вто- 
рого порядка (16.15), покажите, что для всех точек комплексной плоско- 


сти чисел // = рй выполняется условие [2 й <1, где Ар 2 — корни ха- 
рактеристического уравнения (16.56). 
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ГЛАВА 17 | МЕТОДЫ ПРИБЛИЖЕННОГО 
РЕШЕНИЯ КРАЕВЫХ ЗАДАЧ 
ДЛЯ ОБЫКНОВЕННЫХ 
ДИФФЕРЕНЦИАЛЬНЫХ 
УРАВНЕНИИ 


Рассматривается несколько способов приближенного ре- 
шения двухточечных линейных краевых задач для дифференци- 
альных уравнений второго порядка. 

Сначала изучаются методы, позволяющие применить на- 
копленный арсенал методов численного решения начальных за- 
дач. Далее на основе простейших аппроксимаций производных в 
узлах сетки строится удобный для автоматизированных вычис- 
лений метод конечных разностей получения каркасов решений и 
изучается его численная устойчивость. Из приближенно-анали- 
тических методов здесь представлены метод коллокации и ме- 
тод Галёркина. Показывается, как можно подбирать требуе- 
мые этими методами системы базисных функций в случае 
произвольных линейных краевых условий. В развитие метода 
Галёркина выводятся расчетные формулы метода конечных эле- 
ментов, где в качестве базисных функций используются 
В-силайны. Подобно конечноразностному методу его примене- 
ние сводится к решению линейных алгебраических систем с 
трехдиагональными матрицами коэффициентов. 


17.1. ПОСТАНОВКА ЗАДАЧИ. КЛАССИФИКАЦИЯ 
ПРИБЛИЖЕННЫХ МЕТОДОВ 
Будем рассматривать двухточечные краевые задачи для 


обыкновенных дифференциальных уравнений второго поряд- 
ка. Общий вид таких задач 


Е У, У) =0, хе [а, В], (17.1) 
91 (У(а), у’(а)) = 0, $2 (>(Б), У'(Ь)) = 0, | 
где ЕЁ, $1, — заданные функции определенной гладкости. 


Наиболее употребительны и лучше всего изучены линейные 
краевые задачи, т.е. задачи вида (17.1), в которых Ё, Фу и $2 — 
линейные функции. Для определенности будем считать основ- 
ным объектом дальнейшего изучения линейную краевую задачу 


Цу| = у" + р(х)у' +а(%)у = /(х), хе[а, В], (17.2) 
1 [у] = @0(а) + виу’(а) = А, (17.3) 
[у] = Воу(ф) + Ву") = В, (17.4) 
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где к коэффициентам краевых условий (17.3), (17.4) предъявля- 
ется требование 


[6+ 64| *0, |В|+|8=0, (17.5) 


а функции р = р(х), а=а(х) и Г= Л (>) в уравнении (17.2) 
должны быть такими, чтобы данная задача имела единственное 
решение у= у(х) в заданном функциональном пространстве. 


Краевые условия (17.3) , (17.4) определяют так называемую 
третью или, иначе, смешанную краевую задачу для уравнения 
(17.2), содержащую в себе первую (когда с = В =0) или 
вторую (при @ = д =0) краевые задачи. Оставив в стороне 
важный случай периодической краевой задачи, когда вместо 
(17.3), (17.4) выставляются условия у(а) = у(Б), у’(а) = УВ), 
будем конструировать методы приближенного решения сме- 
шанной задачи (17.2)—(17.4), лишь изредка выделяя случаи 
первой и (или) второй задач, если это окажется существенным. 
Как известно, точное (аналитическое) решение краевых за- 
дач вызывает еще большие трудности, чем решение задач Коши. 
Отсюда — повышенный интерес и большое разнообразие при- 
ближенных методов решения таких задач. По типу представле- 
ния результатов приближенного решения методы можно разде- 
лить на две группы: приближенно-аналитические, дающие 
приближенное решение краевой задачи на отрезке [а, 6] в виде 
некоторой конкретной функции, и собственно численные или се- 
точные методы, дающие каркас приближенного решения на за- 


данной на [а, 6] сетке”). По идейной основе приближенных ме- 
тодов их можно классифицировать следующим образом: 

1) методы сведения к задаче Коши (метод пристрелки, ме- 
тод дифференциальной прогонки, метод редукции); 

2) метод конечных разностей; 

3) метод балансов или интегро-интерполяционный метод; 

4) метод коллокации; 

5) проекционные методы (моментов, Галёркина); 

6) вариационные методы (наименьших квадратов, Ритца); 


7) проекционно-разностные методы (метод конечных эле- 
ментов); 


8) методы сведения к интегральным уравнениям Фредголь- 
маи др. 


* 
) При этом некоторые методы первой группы также предполагают 
использование сетки. 


619 


Методы 4...6 из вышеперечисленных приводят к прибли- 
женному решению в виде функции заданного семейства (линей- 
ной комбинации некоторой системы линейно независимых 
функций), методы 1...3 и 7 генерируют таблицы численных зна- 
чений приближенного решения, в методах 8 возможны варианты. 
Как правило, чисто сеточные методы являются более простыми и 
позволяют технически легко строить каркас решения на задан- 
ной сетке с наперед заданной точностью, контролируемой, на- 
пример, по принципу Рунге. Однако и приближенно-аналити- 
ческие методы имеют свои достоинства, одно из которых 
очевидно — это лаконичность функционального представления 
решения; другое же их достоинство состоит в том, что некоторые 
методы этой группы позволяют получать хорошие приближения 
к обобщенным решениям краевой задачи, когда она не имеет 
единственного решения в классическом смысле. 

Ниже будут рассмотрены идеи и некоторые реализации 
методов 1, 2, 4, 5, 7 приведенного списка; при желании познако- 
миться с другими методами или с иным освещением перечис- 
ленных читатель может обратиться к другим учебным пособиям, 
например, к [3, 13, 20, 62, 100, 131, 158, 181]. 


17.2. МЕТОДЫ СВЕДЕНИЯ КРАЕВЫХ ЗАДАЧ 
К НАЧАЛЬНЫМ 


Имея в виду, что нами изучено много способов прибли- 
женного решения задач Коши для ОДУ, можно считать краевую 
задачу принципиально решенной, если ее удастся преобра- 


зовать к эквивалентной начальной задаче”). Известно несколько 
приемов, с помощью которых можно это сделать. Эти приемы 
приводят к необходимости решать не одну, а несколько задач 
Коши разной сложности при различных ограничениях на пара- 
метры исходной задачи. Рассмотрим вкратце три таких приема. 


* 

) Автор считает уместным напомнить здесь весьма популярную в 
математических кругах притчу о различии подходов к решению приклад- 
ных задач двух групп людей, представителей которых будем условно на- 
зывать «практик» и «теоретик». 

Практику и теоретику дали по доске с забитым по шляпку 
гвоздем и инструменты: молоток и клещи, предложив вытащить гвоздь. 
Повозившись, оба справились с задачей (не будем уточнять, кто быстрее). 
Второе задание состояло в том, чтобы вытащить гвоздь, вбитый в доску 
лишь наполовину. Практик взял клещи и вытащил гвоздь. Теоретик 
взял молоток и со словами: «Задача сведена к предыдущей», забил гвоздь 
по шляпку. 
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Метод пристрелки. Пусть требуется найти приближенное 
решение уравнения (в общем случае нелинейного) 


у" = Л(х, у, У), хе[а, В] (17.6) 
с краевыми условиями первого рода 
У(а)=А, УБ=В. Ц. 


Зададимся некоторым числом С1 и будем рассматривать за- 
дачу Коши для уравнения (17.6) с начальными условиями 

уа)=А, у@)=С!. 

Предположим, что на отрезке [а, В] построено приближен- 
ное решение у = у (х, С1) этой начальной задачи. Сравнение 
значения у (Ь, С\) полученного решения в точке х = Ь с задан- 
ным, согласно (17.7), значением В дает информацию для кор- 
ректирования угла наклона касательной к решению 
у = у>2(х, С>) новой начальной задачи с условиями 

У(а)=А, у(а)=С» 
так, чтобы уменьшить разницу В- у>(Ь, С›). На этой основе 
могут выстраиваться те или иные стратегии варьирования зада- 
ваемых значений у’(а)=С1, Со, Сз,й ‚ обеспечивающих, по 
возможности, наиболее быструю практическую сходимость к 
числу В  последовательности приближений у,(Ь,С,) 


(К =1,2, 3,й )°). Если при заданном & > 0 и некотором А =и 
будет выполнено неравенство |В- у„(Ь, С„] <=, за искомое 
приближенное решение краевой задачи (17.6)—(17.7) принимает- 
ся функция у = у„(х, С») (дискретная или непрерывная). 


У= укх, С!) 


Ук6, С!) 


р 
Рис. 17.1. Геометрическая интерпретация одного шага 


метода пристрелки 


*) См., например, [3, 178]. 
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Схематично описанный способ получения приближенного 
решения первой краевой задачи путем последовательного реше- 
ния нескольких задач Коши для того же уравнения называют 
методом пристрелки (или стрельбы). Такое название стано- 
вится естественным, если рассмотреть геометрическую (или, ес- 
ли угодно, баллистическую) интерпретацию метода (рис. 17.1). 


Метод редукции. Будем искать решение у = у(х) линей- 
ной краевой задачи (17.2)—(17.4) в виде 
у = Си) + у(х), (17.8) 
где С ии=и(х), у = у(х) — некоторые постоянная и функции, 
условия на которые будут накладываться ниже. 
Сначала потребуем, чтобы функция (17.8) была решением 
уравнения (17.2) при любом значении постоянной С, т.е. что- 


бы имело место 
ЦСи+у]=} УСЕБВ. 


В силу линейности заданного в (17.2) дифференциального опера- 
тора Г, последнее можно переписать в виде 


СИи]- Цу|=7 УСЕК, (17.9) 
а так как постоянная С’ должна быть произвольной, то уравнение 
(17.9) равносильно системе 
Ци] = 0 
, 17.10 
ы. р 


Теперь воспользуемся линейностью краевого усло- 
вия (17.3). Имеем: 


[У] = [Си + у] = СЦ и] +14 =А УСЕК 


Ви =0, и(а) + оци'(а) = 0, (17.11) 
— 
|" Ь]=А ме +2у'(а) = А. (17.12) 


Равенство (17.11) будет выполнено, если положить, на- 
пример, 


и(а) =, и(а)=-9. (17.13) 
Для удовлетворения равенства (17.12) можно взять 
ЕЯ у(а)=0, (17.14) 
40 
если @0 = 0, или 

А 

у(а)=0, у(а)=—, (17.15) 
а 
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если 0/1 = 0. Заметим, что одновременно @ и а в нуль не об- 
ращаются, в силу условия (17.5); неоднозначность задания на- 
чальных условий для и и у связана с лишней степенью свободы: 
одна неизвестная функция у заменяется линейной комбинацией 
двух функций (и иу). 

Итак, согласно (17.10), функции и и ъ в представлении ре- 
шения (17.8) можно найти, решая уравнения 


и" + р(хи' + а(хи = 0 (17.16) 
и 
у" + р(х)у' + а(х)у = 1(х) (17.17) 
с начальными условиями (17.13) для (17.16) и с начальными ус- 
ловиями (17.14) или (17.15) для (17.17), применяя какие-либо ме- 
тоды решения задач Коши для уравнений второго порядка 
(см. гл.15). Приближенное решение этих задач строится на отрез- 
ке [а, 6], в результате чего становятся известными, в частности, 
значения и(Ь), м’(Ь), »(Ь), у'(Б). Это позволяет подобрать посто- 
янную С так, чтобы с этим значением С и найденными функ- 
циями и(х) и у(х) функция у = Си + удовлетворяла не только 
уравнению (17.2) и условию (17.3), но и второму условию (17.4). 
Имеем: 
Ур = Си + у] = СЫ + 15] = В, 
если 
В-[ В- — Ду 
с_В-ЬЬ] _В- В - "Фу 
[и] Вои(Ь) + Ви’(Ь) 


Замечание 17.1. Если знаменатель выражения С в (17.18) ока- 
жется равным нулю, это будет означать, что однородная краевая задача 


Ци=о0, 1[и]|=0, №[и|=0 


имеет нетривиальное решение и(х), что, в свою очередь, служит призна- 
ком вырожденности исходной задачи (17.2)—(17.4). 


Метод дифференциальной прогонки”). При выводе мето- 
да прогонки решения линейных алгебраических систем с трех- 
диагональными матрицами коэффициентов, т.е. для трехточеч- 
ных разностных уравнений второго порядка, связывающих три 
соседние компоненты вектора неизвестных системы, в гл. 2 мы 
исходили из предположения о наличии связей между каждыми 
двумя соседними неизвестными и получали рекуррентные фор- 
мулы для коэффициентов таких связей. Проводя параллель меж- 
ду линейными дифференциальными и линейными разностными 


* 
) Метод разработан И.М.Гельфандом и О.В.Локуциевским [20, 131]. 
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уравнениями, предположим, что существуют такие две функции 
6 =56(х) иу = 7(х), с помощью которых решение у = у(х) дан- 
ного линейного дифференциального уравнения второго порядка 
(17.2) может быть представлено как решение уравнения первого 
порядка 


у’ = д(х)у + 7(х). (17.19) 
Продифференцируем это равенство и подставим выраже- 
ние второй производной у’ =ду+ ду’ +у’ в исходное уравне- 
ние (17.2). Имеем 
буду + ра =, 
откуда, выразив у’, получаем равенство типа (17.19): 
Иа ПИРЫ (17.20) 
9+р О+р 
Уравнения (17.20) и (17.19) можно отождествлять при условии, 
что 
__ 9+4 
б+р’ 
И 
9+р 


а 


Следовательно, функции б =6(х) и у=7(х) должны удовле- 
творять системе дифференциальных уравнений первого порядка 

{5 =-рс9б - 6? -4(@), (17.21) 

у’ = (ро) + 6)у + Ло). (17.22) 

Чтобы найти начальные условия для уравнений системы (17.21), 


(17.22), учтем, что решение у(х) в точке а должно удовлетво- 
рять уравнению (17.19), т.е. должно выполняться равенство 


у’(а) = 6(а)у(а) + (а). (17.23) 


С другой стороны ‚, в предположении, что @| = 0, из краевого 
условия (17.3) для того же решения в точке а имеем 


зы бы (17.24) 
[а те 
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Сравнение (17.23) с (17.24) приводит к начальным условиям 


За) =-—%. (17.25) 


7(а)= ЕЯ (17.26) 
та 


Решив на отрезке [а, ] задачу Коши для системы (17.21), 
(17.22) с начальными условиями (17.25), (17.26), получим тре- 
буемые для уравнения (17.19) функции д(х) и у(х). Для нахож- 
дения частного решения у(х) уравнения (17.19), служащего од- 
новременно решением данной краевой задачи, аналогично 
предыдущему запишем равенство 


У(Б) = 9(Б)у() + У(Б) 
и подставим это выражение у’(Ъ) в краевое условие (17.4): 


Воу(Ь) + Виб(Б)у(Ь) + Вх) = В. 
Отсюда получаем привязку решения у(х) в точке В: 
В- В17(Б) 
Во + В15(Ь) 


(если Ву + Виб(Ь) * 0). Остается решить задачу Коши (17.19), 
(17.27) от точки В к точке а. 

Таким образом, метод дифференциальной прогонки ре- 
шения линейной краевой задачи (17.2)-—(17.4) заключается в ре- 
шении трех начальных задач для дифференциальных уравнений 
первого порядка: сначала параллельно (или последовательно в 
записанном порядке) решаются уравнения (17.21), (17.22) с на- 
чальными условиями (17.25), (17.26) в прямом направлении от а 
к Ь, затем в обратном направлении от В к а решается уравне- 
ние (17.19) с начальным условием (17.27). 

При численной реализации этого метода следует обратить 
внимание на необходимость согласования расчетных сеток ре- 
шения начальных задач в одном и в другом направлениях так, 
чтобы имелась возможность получения решения последнего 
уравнения (17.19) с нужной точностью при условии, что в про- 
цессе численного интегрирования вспомогательных уравнений 
(17.21), (17.22) находятся лишь каркасы функций д(х) и у(х) на 
своих сетках. 


У(Б) = (17.27) 


Замечание 17.2. Если не выполняется сделанное выше предполо- 
жение ©! * 0, то вместо описанной дифференциальной прогонки, кото- 
рую естественно назвать левой, можно применить правую прогонку, 
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предполагая Д\ = 0. Для этого достаточно начальные условия для нахож- 
дения функций б(х) и У(х) вывести из краевого условия (17.4), а для 
У(х) — из (17.3). В результате придется строить вспомогательные реше- 


ния, т.е. решать систему (17.21), (17.22) в направлении от В к а, а оконча- 
тельное решение у(х) находить из уравнения (17.19) в прямом направле- 
нии от а к ВБ. Очевидно, что когда а! = В! =0, т.е. в случае первой 
краевой задачи, рассмотренный выше метод дифференциальной прогонки 
неприменим (можно сказать, что они дополняют друг друга с методом 
пристрелки). 


Имеются и другие способы сведения краевых задач к на- 
чальным (см., например, [92]). 


17.3. МЕТОД КОНЕЧНЫХ РАЗНОСТЕЙ 


Идея метода конечных разностей (МКР”)) решения 
краевых задач весьма проста и видна уже из самого названия: 
вместо производных в дифференциальном уравнении использу- 
ются их конечноразностные аппроксимации. Эта идея уже при- 
менялась нами в $ 16.2 при построении простейших разностных 
схем решения задачи Коши. В отличие от того случая, где дис- 
кретным аналогом начальной дифференциальной задачи служила 
начальная задача для разностного уравнения, что позволяло по- 
следовательно, шаг за шагом, находить компоненты каркаса 
приближенного решения, здесь, т.е. для краевой дифференци- 
альной задачи, будет получаться краевая же задача для разност- 
ного уравнения, а это ведет к необходимости решать алгебраиче- 
скую систему. Ясно, что при построении дискретных 
аппроксимаций краевых дифференциальных задач нужно стре- 
миться увязать две, возможно, противоречивые цели: хорошее 
качество аппроксимации и р етИвНОЕ и устойчивое решение 
получающихся при этом алгебраических систем. 

Рассмотрим наиболее типичные воплощения указанной 
идеи МКР для линейной краевой задачи (17.2)—(17.4). 


2-а . 


Сначала вводим на отрезке [а, Ь] сетку с шагом й= 


2 |=: 1=0й 3 ща д. 
На этой сетке определяются сеточные функции 


р=Р@), а=а@), Л=ГО», (17.28) 
отвечающие функциональным коэффициентам данного диффе- 
ренциального уравнения (17.2). Считая у(х) точным решением 


данной краевой задачи (17.2)—(17.4), через 


Е. Зарубежная аббревиатура ЕОМ — от англ. Дийе @егеисе тейоа. 
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У: = У(х:) (17.29) 


будем обозначать 1-ю компоненту искомого каркаса приближен- 
ного решения у, (х) = у(х). 

Фиксируя в уравнении (17.2) х=х;, с учетом обозначе- 
ний (17.28) приходим к равенствам 


У"(х)) + РУ) + Ух) = Л, (17.30) 


где целая переменная / может принимать значения от 0 до и по 
числу узлов сетки, а под у(х;), у’(х;), у’(х;) понимаются значе- 
ния точного решения у(х) и его производных в {-ом узле. В ка- 
ждом внутреннем узле сетки @р, т.е. при 1=12,Й ‚п-1, зна- 
чения производных аппроксимируем  конечноразностными 


отношениями по симметричным формулам второго порядка точ- 
ности (см. (13.18) и (13.20)): 


У'(х;) г УС) д У(х 1) З О(#^), 
2й 
У@ни) — 2х) + УФ) 
и2 
В результате подстановки последних в равенства (17.30) при 
1=1,2,й ‚ п-1 получаем 


Убил) - 2у(х;) + убил) Уи) - У) 
Ы—_ + 
и2 21 
2 
+ 4:У(х;) = Л + Ой”). 

Это уравнение служит точным отражением дифференциальной 
связи (17.2), но в нем имеется неопределенное слагаемое О(И^). 
Отбрасывая его, приходим к разностному уравнению относи- 
тельно приближенных значений решения (обозначения которых 
соответствуют (17.29)): 


У-2У; + У Ут УР 
71+ — 7 о +4 д (17.31) 


После приведения подобных членов в (17.31) получаем стан- 
дартное трехточечное разностное уравнение второго порядка 


й й 
(+5 Руни - @- п? 4г)у; + (1 => Ру = и? у, (17.32) 


гдег=1,2,й ,п-1. 


У"(х;) = + О(#?). 
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Интерпретируя (17.32) как компактную запись системы 
линейных алгебраических уравнений с трехдиагональной матри- 
цей коэффициентов, видим, что число уравнений в ней и-1, в 
то время как неизвестных — и+1: уд, У,й ‚, У„. Два недос- 
тающие уравнения этой системы ( или, в другой терминологии, 
краевые условия разностного уравнения (17.32)) следует полу- 
чить на основе краевых условий (17.3), (17.4) данной задачи. 

Будем рассматривать два варианта аппроксимации входя- 
щих в краевые условия значений первой производной решения в 
точках а=хо и Б=х,. Именно, здесь идет речь о несимметрич- 
ных аппроксимациях первого и второго порядков точности (дос- 
тоинства и недостатки каждого из этих вариантов будут обсуж- 
дены позже). 

Согласно формулам (13.15), (13.26), (13.14) и (13.27), мож- 
но записать равенства 


= Нин +0®)= лил + 0(1?), 
75) = а +0(®) = и 4: О(?). 


В первом варианте, при аппроксимации у’(а) и у’(Б) в 
(17.3) и (17.4) двухточечными разностными отношениями перво- 
го порядка, имеем 


и о =. 


ао У(хо ) + 1 


Ух) У(хи_1) 
Руа И 
Отсюда после отбрасывания слагаемого О(й) (с заменой у(х;) 
на у;) и упрощения получаем краевые условия для разностного 
уравнения (17.32), иначе, нулевое и и-е уравнения 


(10 —@)у0 + = АЙ (17.33) 


+О®)= В. 


— Виуи-1 + (ИВо + Ву» = ВИ (17.34) 


системы алгебраических уравнений, задаваемой равенст- 
вом (17.32). 
Во втором варианте имеем аналогично 


0у(хо) + 2 НЕ ар -=А, 
ообть) + Ваь + оруз) = В, 
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откуда следуют дополнительные к (17.32) связи между тремя 
первыми неизвестными 


(2йа0 -- Зо )Уб + 40 У — ЧУ = 2 АЙ (17.35) 
и тремя последними 
В\ун-2 — 4,1 + @АВо +3В)у» = 2ВВ. (17.36) 


Сравним теперь два рассматриваемых варианта. В первом 
из них СЛАУ, образованная уравнениями (17.33), (17.32), 
(17.34), имеет трехдиагональную матрицу коэффициентов, и к 
ней сразу можно применить высокоэффективный метод прогон- 
ки ($ 2.6). Во втором случае соответствующая методу прогонки 
структура матрицы коэффициентов СЛАУ еще должна быть с03- 
дана, для чего нужно из уравнения (17.35) с помощью уравнения, 
получающегося из (17.32) при Г =1, исключить неизвестное у, 
а из (17.36) с помощью (17.32) при {=и-1 исключить у„_о. Ус- 
ложнения, сопутствующие второму варианту, могут быть оправ- 
даны тем, что в этом случае исходная дифференциальная краевая 
задача полностью аппроксимируется алгебраической системой 


относительно компонент каркаса решения с точностью О(®^), | 
то время как о первом варианте такого сказать нельзя (если, ко- 
нечно, речь не идет о первой краевой задаче, т.е. о случае 
о = В! = 0, когда в аппроксимации краевых условий вообще нет 
нужды). Однако в поисках компромисса между качеством ап- 
проксимации и численной устойчивостью при решении конкрет- 
ных задач первый вариант может оказаться и более предпочти- 
тельным. 


Остановимся теперь на вопросе устойчивости построенной 
конечноразностной схемы решения краевой задачи (17.2)—(17.4). 
Как отмечалось ранее, эту устойчивость можно связать с устой- 
чивостью метода прогонки, что, в свою очередь, можно гаранти- 
ровать, когда матрица коэффициентов имеет свойство диаго- 
нального преобладания (теорема 2.2). Посмотрим с этой точки 
зрения на 71-е «внутреннее» уравнение системы, т.е. на уравне- 
ние (17.32). 

Условие диагонального преобладания для (17.32) означает, 
что должно выполняться неравенство 


Р-1?а| > + УЕ, 2,й ,п- Ц. (17.37) 


р 
НР 


Рассмотрим, что представляет собой правая часть этого неравен- 
ства. Раскрывая модули, имеем 


—йр;, если Йр;<-2, 
= 2 , если |Р<2, 
йр;, если йр;>2. 


й 
НЙ $: эй 
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Следовательно, правую часть неравенства (17.37) как функцию 
переменной йЙр; (считая ее изменяющейся непрерывно) в услов- 
ных координатах можно представить в виде графика, изобра- 
женного на рис.17.2. 


Ир; 
Рис. 17.2. Условный график правой части неравенства (17.37) 


Так как левая часть неравенства (17.37) при а; > 0 и малых 


| >0 (малость Й нужна из требований аппроксимации) меньше 
2, то на устойчивость прогонки можно рассчитывать лишь в слу- 
чае, когда 4(х) < 0. При этом имеет место 


Р- 1? =2-14,>2 4. 


Чтобы в таком случае неравенство (17.37) выполнялось при лю- 
бых р(х), для правой его части считаем допустимым только зна- 
чение 2 (Т.е. используем горизонтальную часть графика на 
рис.17.2). Отсюда получаем ограничение 


ИР; < 2, 
означающее, что устойчивость прогонки можно гарантировать при 
условии, что шаг дискретизации й удовлетворяет неравенству 
2 : 
ий<— УЕ, 2,й ,п-П. 
[р 
Усиливая это неравенство и используя сформулированное в кон- 
це $ 16.1 утверждение «Аппроксимация плюс устойчивость дает 


сходимость», приходим к заключению, что если в дифференци- 
альном уравнении (17.2) 


4) <0 Ухе][а, В], (17.38) 


а в определяющем МКР разностном уравнении (17.32) 
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2 
—_—__ 
тах х 
хе[а, < у" 
то МКР сходится (по крайней мере, к решению первой 
краевой задачи, т.е. когда в (17.3), (17.4) а: = В =0; в других 
случаях требуется более детальный анализ). 


Наличие ограничения на шаг Й в методе конечных разно- 
стей второго порядка (17.32) характеризует его как условно ус- 
тойчивый метод. Если отказаться от аппроксимации всех произ- 
водных с порядком О(Р?) и использовать в роли у’(х;) правые 
или левые разностные отношения первого порядка точности, 
связывая их выбор со знаком р;, а именно, рассматривая вместо 
(17.31) разностное уравнение 


Уч У 
— ————°,если р;>0 
Уни- 2УЕ + У 
р РВ +а:=Л 
й В если р;<0 
при 1 =1,2,й ‚ п-1, придем к Нора методу 


2 
у1-(2+йр; -й аду: ++ ру =, Л» еблир; >0, (1739) 


= Ир;)у1 — @= пр 1? Чг)у; "У = =. Уз еслир;< 0, 
имеющему первый порядок точности независимо от точности 
аппроксимации краевых условий. 

Легко видеть, что при условии (17.38) диагональное преоб- 
ладание в методе (17.39) будет при любой величине шага й > 0. 
Отсюда следует его безусловная устойчивость, правда в ущерб 
точности; последнее означает необходимость проведения вычис- 
лений с более мелким шагом для доведения погрешности реше- 
ния до некоторой фиксированной малой величины, чем это тре- 
бует метод второго порядка (17.32), если они оба одновременно 
применимы. Конечноразностный метод (17.39) широко исполь- 
зуется при решении задач динамики жидкости и газов и называ- 
ется ирита- или противопотоковым методом. 


17.4. МЕТОД КОЛЛОКАЦИИ 


Будем искать приближенное решение линейной краевой 
задачи (17.2)—(17.4) в виде функции 


у, (х) = 20) + $'с:Ф; ©), (17.40) 
= 
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где определяемые на отрезке [а,Б] базисные функции 
Ф;(х) (1=Ь2,йЙ ‚п) и дополнительная функция Фо(х) долж- 
ны быть дважды дифференцируемыми и попарно линейно неза- 
висимыми. Кроме того, функция Фо(х) должна удовлетворять 
данным краевым условиям (17.3), (17.4), а функции $ф;(х) при 
1=2,й ‚ п — соответствующим однородным краевым услови- 
ям, т.е. должны выполняться равенства 


'(а)=0, 
@Ф;(а)+ Фа) 91 {1,2,й ‚п}. (17.41) 


ВофЕ(Б) + ВФИЬ) =0 
В таком случае функция у„(х), определяемая выражени- 
ем (17.40), при любых значениях коэффициентов с; гарантиро- 


ванно удовлетворяет краевым условиям (17.3), (17.4). Действи- 
тельно, например, в точке х =а имеем 


уп (а) + оу(а) = 


И И 
= @0фо(а) + а1Фо(а) + “0 Уса) + м У сФКа) = 
= Ги 


п 

= А+ > с [0 фКа) + ифКа)] = А; 
1=1 

аналогично при х =В с помощью (17.4), (17.40) и (17.41) прове- 

ряется справедливость равенства 


Воу»(Ь) + Влун(Ь) = В. 
Представление приближенного решения у„(х), подобное 


(17.40), характерно для многих приближенно-аналитических ме- 
тодов решения краевых задач (возможны вариации требований к 
базисным функциям); главное их различие состоит в том, на ка- 
кой основе ищутся коэффициенты с; в линейной комбинации ба- 


зисных функций 0;(х) выражения (17.40). 


* 
В методе коллокации ) коэффициенты с; в представле- 
нии (17.40) приближенного решения у„(х) подбираются так, 
чтобы в узлах коллокации х; таких, что 


а<х! <х2 <й <х, <Ь 


(не обязательно равноотстоящих, но строго внутренних точках 
отрезка [а, 6]), значения у„(х;) приближенного решения были 
согласованы с точными значениями у(х;). 


* 
) СоПосайо (лат.) — размещение, расстановка. В книге [80] такой 
метод называют интерполяционным методом или методом совпадений. 
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Поскольку точное решение у(х) задачи (17.2)—(17.4) неиз- 
вестно, согласование у„(х)и у(х) в узлах коллокации х; прово- 
дим подстановкой у„(х) в уравнение (17.2). Имеем равенство 

Ут (х,) + Роу (хр) + ау, (хр) = ЛО, (17.42) 
которое, в силу выставляемого требования согласования у„(х;) с 
у(х;), считаем точным при каждом Ге 1, 2,й ‚п. Продиффе- 
ренцировав дважды функцию у„(х) в представлении (17.40), от 
ао (17.42) перекодим к ыы 


Херт )+Р; Хе 7+ Хевия = 
1=1 
=Л ВО - рой ва, (17.43) 
где р»а; Г, соответствуют обозначениям (17.28) сеточных 
функций. Положим 


ау := Фу(х,) + рФ'(х;) +4: (х;), (17.44) 
= Др - 90(%1) — Ро (Хр - 9:90). (17.45) 


Тогда (17.43) приобретает стандартный вид линейной алгебраи- 
ческой системы 


Харе о. (17.46) 


относительно ме и С], с2,й ‚си. Решив эту систему 
каким-нибудь стандартным методом и подставив найденные ко- 
эффициенты с; в выражение (17.40), получаем приближенное 
решение у„(х). 


Успех применения метода коллокации к задаче 
(17.2)—(17.4), впрочем, как и других приближенно-аналитических 
методов, сильно зависит от удачного выбора базисных функций 
Ф;(х) в представлении приближенного решения (17.40). В кон- 
кретных задачах выбор таких функций, по возможности, должен 
опираться на априорные или эмпирические сведения о решении. 
В отсутствие таковых, т.е. в рассматриваемом абстрактном слу- 
чае, для смешанной краевой задачи (17.2)—(17.4) можно предло- 
жить, например, следующий набор базисных функций. 

В качестве ф () возьмем линейную функцию 


Фо =б+ух, (17.47) 


коэффициенты которой подберем так, чтобы она удовлетворяла 
неоднородным краевым условиям (17.3), (17.4), т.е. из линейной 
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алгебраической системы 


@0д + (ва +2) =А, 
17.48 
тв о 
Функции 0;(х) при 1=12,й ‚и можно взять однопара- 
метрическими вида 

ф/(х) = ух фа) ее (17.49) 

если в (17.3) | =0, или вида 
Фи(х) = уха) + (ха)? (17.50) 


в самом общем случае. Очевидно, что при любых у; эти функ- 


ции удовлетворяют первому из требуемых равенств (17.41)°), а 
если зафиксировать 
-а)? ++ (6- 
у, = „Я -я + +-ВА- (17.51) 
Во(Ь — а) + 1 
в выражении (17.49) и 
2 : 
Ь- + (+ 2)61 (6 - 
у, = _в -а ++ (17.52) 
Во -а) + 1+ ПВ 
в (17.50), то они будут подчиняться и второму из этих равенств. 
Следовательно, можно рассчитывать, что с такими базисными 
функциями при найденных методом коллокации (или каким- 
либо другим методом) коэффициентах с; определенная посред- 
ством (17.40) функция у,„(х) будет удовлетворять краевым усло- 
виям и может служить приближенным решением данной краевой 
задачи (17.2)—(17.4). 

Проблема формального выбора базисных функций ф; зна- 
чительно упрощается в случае, когда в задаче (17.2)—(17.4) фигу- 
рируют однородные краевые условия первого рода, т.е. 
когда 


У(а)=0, у) =0. (17.53) 
В такой ситуации в выражении (17.40) не нужна функция фу, ав 
роли ф; (1=1,2,й , п) могут выступать, например, функции 


ф/(х) = (х-а)'(-х) 


* 
) Если @| = 0, то первому из равенств (17.41) не удовлетворяет од- 
на функция семейства (17.49), а именно ‹4(х). 
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ИЛИ 
. Их-а 
Ф;(х) = РН 
Ь-а 
К этому случаю, т.е. к условиям (17.53), легко свести более об- 
щий случай неоднородных краевых условий первого рода 
у(а)=А, УБ=В. (17.54) 
С этой целью достаточно сделать линейную замену (линейный 
сдвиг) 


-. (ха). 

—а 
Дважды дифференцируя эту функцию у и подставляя результа- 
ты в уравнение (17.2), от задачи (17.2), (17.54) приходим к крае- 
вой задаче с однородными краевыми условиями относительно 
новой переменной и: 


Уу=ич+у, Где У=А+ 


и’ роди +абди = Лод род - 90), хе Ы, 


и(а)=0, и =0. 


Пример 17.1. Применим метод коллокации для приближенного 
представления решения краевой задачи 


ху" + хбу' — хЗу=6-3х3, хе[| 2], 
У =1, 35(2)+ (2) =0.5. 


Составив систему (17.48) относительно коэффициентов б и у функции 
Фо(х) вида (17.47) 
| +У=1, 


36 +7у = 0.5, 
находим удовлетворяющую данным краевым условиям линейную функ- 


(17.55) 


цию $0 (х) = В = Ограничиваясь одной базисной функцией $1 (х) ви- 


да (17.49), по формуле (17.51) вычисляем коэффициент 
__3@-12 +220-0__5 
32 = +151 4 
подстановка которого в (17.49) при {=1 дает базисную функцию 
5 
Фи(х) = (х- 12 - 4-1. 


Возьмем в качестве узла коллокации середину рассматриваемого 


› 


3 
промежутка — точку х| = р и потребуем, чтобы функция 


У (х) = Ф0(х) + с1Ф1(х) 
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удовлетворяла в этой точке заданному дифференциальному уравнению. 
Подставив в него 


= а и У=2 
я [+ $ 4 я 1, 


получаем с| =——. Таким образом, простейшая коллокация с одним уз- 
т 864 


лом приводит к приближению решения данной краевой задачи (17.55) 
квадратичной функцией 


=] 701 9 
У (х) =1 = = и 


1 
(ее точное решение у(х) = = ). 
р 


Замечание 17.3. Приближенное решение у„(х) (17.40), согласно 
идее метода коллокации, в точках коллокации х; ® (а, Ь) должно удовле- 
творять данному дифференциальному уравнению (17.2). Казалось бы, в 
этих точках оно должно совпадать с точным решением у(х) данной крае- 
вой задачи (17.2)—(17.4). Однако это не так, в чем легко убедиться, срав- 
нив полученное в примере 17.1 приближенное решение в узле коллокации 


х ->. равное у] С) = 0.38, с точным значением решения 55-09 


(см. также сравнение графиков у|(х) и у(х) далее на рис.17.3) 


Замечание 17.4. Нет принципиальных препятствий к привлечению 
метода коллокации для приближенного решения нелинейных крае- 
вых задач. Трудности на этом пути ожидают при подборе базисных функ- 
ций ф;, удовлетворяющих краевым условиям (17.1) в случае их нелиней- 
ности, и в необходимости решать нелинейные системы при отыскании 
коэффициентов с; того же представления (17.40) приближенного реше- 
ния. Например, если данное дифференциальное уравнение имеет вид 


у" = Л(х, у, У), 
то коэффициенты с1, с2,Йй ‚с, в представлении у„(х) вида (17.40) долж- 
ны находиться из системы 
п м п п . 
Хе (х,) = Л(хь, Хе Ф(х,, >е/Ф'(х,)), 
1=0 1=0 7=0 
где 1 =1,2,Йй ‚и, а со =1 (или со := 0, если это дифференциальное урав- 


нение сопровождается краевыми условиями первого рода). 
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17.5. МЕТОД ГАЛЁРКИНА 


Чтобы лучше понять основную идею проекционных мето- 
дов, наиболее ярким представителем которых является метод Га- 
лёркина, ненадолго отвлечемся от рассматриваемой краевой за- 
дачи и сделаем небольшой экскурс в функциональный анализ. 

Пусть Ё — некоторый линейный оператор, действую- 
щий в гильбертовом пространстве Н ‚ т.е. в полном нормиро- 
ванном пространстве со скалярным произведением (., .). Стоит 
задача приближенного решения операторного уравнения 


у=Х, (17.56) 


т.е. задача отыскания некоторого приближения к неизвестному 
элементу уЕ Н ‚ соответствующему заданному элементу ГЕН. 
Пусть, далее, {ф;}*°| — некоторая полная замкнутая система ли- 
нейно независимых элементов из Н. Ее и первых элементов 
Фь,й ‚ Ф„ выделяют в Н конечномерное подпространство Нь, 


в котором и ищется приближенное решение уравнения (10.56): 


11 
1=1 
Для удобства будем считать, что элемент ГУ принадлежит 
тому же подпространству Ну Тогда к тривиальному равенству 


Л=[у +(-1у,) 


можно применить одну из центральных теорем теории гильбер- 
товых пространств, согласно которой любой элемент гильберто- 
ва пространства может быть представлен в виде суммы опре- 
деленного элемента подпространства (проекции данного 
элемента на подпространство) и определенного элемента про- 
странства, ортогонального к выбранному подпространству 
(реализующего расстояние от исходного элемента до его проек- 


ции) [45, 148]. 
Принадлежность элемента Г - Гу, ортогональному к Н»„ 


подпространству Н: означает, что он ортогонален каждому 
элементу ф;, входящему в базис пространства Н»„. Таким обра- 


зом, при любом 1 =1,2,й ‚и имеем: 


* 

) Представьте себе, например, точку трехмерного пространства в 
декартовой системе координат, спроектируйте ее радиус-вектор на одну из 
координатных плоскостей; полученный при этом прямоугольный вектор- 
ный треугольник может служить простейшей геометрической моделью 
этой теоремы. 
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(-1„)1 > Ф-1„9Ф)=0 > (@у,9,)=(,5,. 


Подставляя сюда выражение у,„ (17.57) и пользуясь простейши- 
ми свойствами скалярного произведения, получаем: 


[1беюня | Ф) > (17.58) 
= 


1 
> УФ, Фе, = (1,9). 
1=1 
Е *) 

Итак, метод Галёркина ' приближенного решения опе- 
раторного уравнения (17.56) сводится к нахождению коэф- 
фициентов с1,й ‚с, линейной комбинации некоторых задавае- 
мых определенным образом линейно независимых элементов 
Ф.й ‚Фи (называемых базисными или координатными элемен- 
тами) так, чтобы эти коэффициенты удовлетворяли линейной 
системе 


Харе, =4, 1=Ь2,В ‚м, (17.59) 
1 


= 
И 


ау = ((Ф„9;), а; = (1,Ф). (17.60) 


Вернемся к краевой задаче (17.2)—(17.4). Естественным для 
ее рассмотрения пространством является гильбертово простран- 
ство [>[а, Ь] функций, интегрируемых на отрезке [а, В] с квад- 
ратом. Скалярное произведение здесь определяется равенством 


(м, ») = да» (17.61) 


Как и в предыдущем параграфе, будем искать приближен- 
ное решение задачи (17.2)—(17.4) в виде задаваемой формулой 
(17.40) функции у„(х) такой, чтобы она удовлетворяла данным 


краевым условиям, а это будет, как мы уже знаем, если 
1 [Фо ]= А, 10 ]= В, 


1 [@;]=0, 5[Ф=0 У! е 1, 2,й ‚ т}. 


а 


* 
) Галёркин Борис Григорьевич (1871-1945) — русский инженер и 
ученый в области теории упругости. 
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Подставляя у„(х) в данное уравнение (17.2), в силу линейности 
определенного там дифференциального оператора Ё[у|, имеем: 


ео ы Фе = > г] Зе =Л-ИФо]. 


Следовательно, в таком случае, наличие дополнительного сла- 
гаемого Фо в представлении приближенного решения (17.40) 


вместо представления (17.57) означает, что равенство (17.58) 
нужно переписать в виде 


п 
[ Хе,Фуь, ” = (7 - 290, Ф), 
7= 
а это, в свою очередь, вносит поправку в выражение 4;, зафик- 
сированное равенством (17.60). Согласно этому замечанию и оп- 


ределению (17.61) скалярного произведения, находим выражение 
свободного члена 4; {1-го уравнения системы (17.59): 


4; = (Х- Ц], Ф;) = 
р 
= ] [70 - 06) — 2х) (>) - аб<)део (хр; (хак. (17.62) 


 ынерь будем выражать коэффициенты а, СЛАУ (17.59) в 


соответствии с записанной в (17.60) формулой и скалярным про- 
изведением (17.61): 


= (1, ;)= 15; (х) + ро, (х) + асдо «рода = 


- - 19) и (хе; (х)ах + розу) "ое оах + |469) „одекхах. 
Первый из ито атом выражении преобразуем «по частям»: 
[о рода = хде! $} — | ф’ (хе (хак, 


а а 
что приводит к следующей формуле для вычисления коэффици- 
ентов при неизвестных с], с2,й , си системы (17.59): 


Ь 
аз = Ф/(Ь)',(Ь) - Ф(а)ф' (а) - [Ф'(х)ф ках + 


а 


р Ь 
+ [род (ходах + [ад х)е(хк. = (7.63) 


а 
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Выполненное преобразование интеграла, во-первых, активизи- 
ровало роль краевых условий при построении приближенного 
решения у„(х) в форме (17.40) (напомним, что функции $;(х) 
при 1=1,2,й ‚п должны удовлетворять однородным краевым 
условиям (17.41)), во-вторых, позволило ослабить требования к 
гладкости базисных функций ф;(х), поскольку теперь, как видно 
из (17.63), у них могут быть даже разрывы производных (скач- 
ки). Подмеченный факт говорит о том, что методом Галёркина 
при подходящем выборе базисных функций можно находить ре- 
шения краевых задач, определенные в каком-либо обобщенном 
смысле. 


Пример 17.2. Снова обратимся к конкретной краевой зада- 


че (17.55), к решению которой у(х) = в примере 17.1 было найдено 
Хх 


квадратичное приближение методом коллокации. 
Используя такое же представление 


Я@=ю@-+8 аж [0 -56-0), (17.64) 


будем теперь искать его коэффициент с! методом Галёркина. Приведя 


данное уравнение в соответствие с видом (17.2), согласно которому имеем 
2 6 3 
Р(х) =х й 4(х) = -х, Я -=—, 
х х 
по формуле (17.63) находим 


ее 
вяе-9-][&- р -За-и- 


2 5 в 2 
-е-о -5е-0) 4 = 0.770, 


а по формуле (17.62) 
- 1 
а = ен а = о =-0.548. 
1 х4 Хх 8 4 
Следовательно, в (17.64) 
=: _ : 
Р- а, 
1 0.770 
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т.е. галёркинское квадратичное приближение к точному решению 


и есть У1(х)=1 Зачот 
57 8 4 


3 
В точке х => таким способом получаем несколько более точное 


213 3 5 
приближение у р ^ 0.42 ку 5), чем найденное ранее методом кол- 


локации. 


Графическое сравнение квадратичных приближений у (х) и У1(х) к 
решению у(х) краевой задачи (17.55), полученных методом коллокации 
(см. пример 17.1) и методом Галёркина, представлено на рис. 17.3. 


Рис. 17.3. Графики точного решения у(х) краевой задачи (17.55) 
и его квадратичных приближений методами Галёркина ( У! (х)) 
и коллокации ( у (х)) 


Замечание 17.5. Возможно, чаще в литературе, освещающей ме- 
тод Галёркина для обыкновенных дифференциальных уравнений, исход- 
ное линейное уравнение второго порядка берут не в принятом здесь за ос- 
нову виде (17.2), а в виде 


— (А(х)у’) +абду = ©), (17.65) 
имеющем прямую физическую интерпретацию и называемом в связи с 
этим одномерным стационарным уравнением теплопроводности или 
одномерным уравнением диффузии (см. [3, 4, 78, 94, 100, 138, 177 и др.]). 
При такой записи уравнения несколько упрощается выражение для 
подсчета коэффициентов ау системы (17.59) и, главное, становится более 


естественным анализ ситуации, когда коэффициенты в (17.65) могут ока- 
заться разрывными. 
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Замечание 17.6. К той же системе (17.59) с коэффициентами 
(17.60) приходят и в методе Ритца, опирающемся на вариационный 
принцип приближенного решения краевой задачи (17.2)—(17.4). Сведения 
об этом методе, а также другие подходы и варианты метода Галёркина 
можно почерпнуть в книгах [20, 81, 84, 117, 126, 147, 177 и др]. Схема- 
тично метод Ритца будет изложен далее в $ 19.5. 


17.6. МЕТОД КОНЕЧНЫХ ЭЛЕМЕНТОВ 


При всех достоинствах метод Галёркина, рассмотренный в 
предыдущем параграфе, обладает тем существенным на совре- 
менном этапе формализации прикладных исследований недос- 
татком, что в «чистом» виде он малопригоден для автоматизиро- 
ванных компьютерных вычислений. Однако при подходящем 
выборе системы простых базисных функций ф; в представлении 


приближенного решения у„(х), связанных с определенной на 


отрезке [а, В] системой точек (сеткой), метод Галёркина транс- 
формируется в сугубо численный процесс получения каркаса 
приближенного решения на заданной сетке, причем технология 
построения этого каркаса в конечном итоге оказывается близкой 
к той, которая присуща методу конечных разностей (см. $ 17.3). 
Отсюда — название такого численного процесса проекционно- 
разностный или проекционно-сеточный метод. Другое его бо- 
лее раннее и более употребительное название метод конечных 
элементов (МКЭ или ЕЕМ от англ. Дийе еетет! тейод) связано 
с другими идеями, корни которых следует искать в строительной 
механике и теории упругости [135]. Преимущества этого метода 
перед многими другими методами обнаруживаются, в основном, 
при решении двумерных и трехмерных задач математической 


физики ’, однако первые представления о МКЭ кажется целесо- 
образным получить именно здесь, развивая метод Галёркина для 
краевой задачи (17.2)—(17.4). 


Введем на отрезке [а,Б] равномерную сетку с шагом 


а | 
й= ‚ состоящую из и внутренних точек (узлов) х; =а+й 


(1 ТУТ ‚ п) и двух крайних — хо =а, хи+1 =Ь. 

Будем искать приближенное решение у„(х) данной краевой 
задачи (17.2)—(17.4) в виде линейной комбинации простых одно- 
типных функций у;(х), на роль которых возьмем так называе- 
мые финитные функции, определяемые равенством 


СПЕ, [#5 
=. |1. (17.66) 


Е. См. об этом далее в $ 19.6. 
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Считая переменную х принадлежащей отрезку [а, 6] и по- 
хх, 
лагая в (17.66) {= —э видим, что 


[#|<1 ©> х-й<х<а+Й, 
т.е. функция Ф(х) отлична от нуля лишь на интервале 
(х;_1, х;+1) с центром в точке х;. Таким образом, разные узлы х; 
рассматриваемой сетки определяют разные функции ф;(х), ко- 
торые, очевидно, согласно (17.66), можно задать равенствами 
Хх-»х Х-хХ;-1 


ЗИ если хЕ [х;1,х; |, 
1-Я если хЕ [х;,Х41 (17.67) 
й р 
0, если хе [х;-1, х+1]. 
График одной такой функции ф; приведен на рис. 17.4. 
1-2 1-1 Хх} 1-1 1+2 х 


Рис. 17.4. График финитной функции ф; 


Сравнение рис. 17.4 с рис. 11.7 и формул (17.67) с формулами 
(11.62) показывает, что введенная здесь финитная функция, ум- 


ноженная на постоянную Га совпадает с определенным в гл. Ы 


линейным В-сплайном. 
Относительно совокупности финитных функций {0}, зада- 
ваемых на отрезке [а, Б] формулами (17.67), известно, что они 


линейно независимы (более того, ортогональны в специальной 
энергетической норме, об этой норме см. далее в $ 19.5, а также в 
& 


[4, 47, 126]) и образуют полную систему ) в пространстве 
15[а, 6]. Это дает основание для их законного применения в ка- 
честве базисных функций метода Галёркина. 

Для дальнейшей конкретизации описанного в общих чертах 
МКЭ нужно уточнить вид системы линейных алгебраических 
уравнений (17.59) относительно коэффициентов с;, с которыми 


* 
) Говоря о полноте, имеем в виду процесс й > 0. 
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должны суммироваться выбранные базисные функции при полу- 
чении приближенного решения, и из (17.60) вывести формулы 
коэффициентов этой системы. С этой целью продифференцируем 
(17.67), получив при этом 


-. при хе(х; 1, х,), 
р 

= при хебщьхн), (17.68) 
0 при хя(храь ху), 


и изобразим параллельно всю систему определенных на отрезке 
[а, Б] функций ф; и их производных ф; (рис. 17.5). 


а) 
Ф1 > Ф! Фр 
а - < - - >-------- 
11 
В! 
= Е РЕЗИНЕ НВ = 
_11%0 м х2 Х1-1 х Хх Хп Хп+1 
р! 
ЕЕ == - "-———%4- -=— 
21 21-1 ф; Фи 
6) 


Рис. 17.5. Система финитных функций ф1, Ф2,й ‚ф)„ (а) 
и их производных (6) 


Из совместного рассмотрения графиков ф; и ф;, наряду с 
уже отмеченным фактом, что 7-я базисная функция и ее произ- 
водная имеют ненулевые значения только на двух смежных эле- 
ментарных промежутках (х;_1, х;) и (х;, х; 1), видим также, что 
на одном элементарном промежутке ненулевыми являются две 
«соседние» базисные функции и их производные: на (х;_1, х;) 
отличны от нуля ф;1, фу, @/-1, @ь на (х;, х+1) — Фр, Фил» Фр 
Ф!+1, и тд. Это позволяет, применив свойство аддитивности по 
промежутку интегрирования к интегралам формул (17.62), 
(17.63) метода Галёркина, упростить их вычисление, отбросив 
заведомо нулевые слагаемые, и увидеть определенную структуру 
матрицы линейной системы (17.59), что облегчает ее решение. 
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Итак, пусть ищется приближенное решение наиболее про- 
стой краевой задачи для дифференциального уравнения (17.2), а 
именно, с однородными краевыми условиями первого рода 


у(а)=0, У()=0. (17.69) 
Для получения ее приближенного решения в виде 
И 
5и(х) = У еФИх) (17.70) 
1=1 


с кусочно-линейными базисными функциями ф; = ф;(х), опре- 
деленными в (17.67), для подсчета коэффициентов с;, согласно 


методу Галёркина, нужно составить линейную алгебраическую 
а (17.59). Ее правню части в таком случае суть 


4; = - ср = У т й (х)оих)ах = 


К=0 х, 


ти НЫ а х Ту Ки 


т ож - ха — “Убе - хи) |. Т.О 
Х;- 1 Хх, 

Так как при краевых условиях (17.69) используются и ба- 
зисных функций с ф| по ф,, и все они в точках а и Б равны ну- 
лю (см. рис. 17.5), то формула (17.63) для вычисления элемен- 
тов ау Я галёркинской СЛАУ (17.59) здесь имеет вид 


арок + | ро бд + [абдр, дрда = 


77] Хк+ 
= $ Пос) + род др) + одре -а7.72) 
К=0 
В силу отмеченного выше неравенства нулю на элементарном 
промежутке лишь соседних по индексу финитных функций и их 
производных, можно считать отличными от нуля фигурирующие 
в выражении а, произведения Ф`фу, Ф'ф’, ф,Ф;, только в тех 
случаях, когда {—1< / < 7+1. А это означает, что 
а; =0 при #- Л>\1, (17.73) 
т.е. матрица А = В и) системы (17.59) имеет ленточную структу- 


ру, точнее, является классической трехдиагональной матрицей. 
Это позволяет применять для ее решения высокоэффективный 
метод прогонки, как и в методе конечных разностей. 
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Конкретизируем формулы для вычисления ненулевых эле- 
ментов матрицы А. Полагая в (17.72) 7 =7, с помощью выраже- 


ний (17.67), (17.68) получаем формулу для вычисления 
ее элементов: 


- -| ‚1 |- вр. ме =) ; 


р - а А+ и иен й в 


=-2+ = ое — хх + рии =’ + 


Хх Хх -1 


ЖН х 

+ Гр@Хх — хх + | а(х)(х — нд (17.74) 
Х Хх 

При /=7+1 из (17.72) находим выражения элементов правой 

побочной диагонали матрицы А системы (17.59): 


*н1 1 1 1 №1 9-% 
па но (еж) окна инь. 
% | й й й й 


я Гид - хак Гоодо-ыдконы (17.79) 


апри /=71-—1 — левой: 


О 1] х-х,/— х-х,) хх, 
аи-= | нае К-Ж 


Хх 


— : = РС: — хр ах + ео = - | (17.76) 


Х-1 Х-1 


Таким образом, можно считать замысел МКЭ принципи- 
ально воплощенным, поскольку формулы (17.71), (17.73)—(17.76) 
полностью задают алгебраическую систему (17.59) для получе- 
ния коэффициентов с1,й ‚с, приближенного решения (17.70) 
краевой задачи (17.2), (17.69). Сделаем лишь несколько замеча- 
ний. 
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Во-первых, находимая описанным способом функция у„(х) 
представляет собой кусочно-линейную аппроксимацию точного 
решения у(х) краевой задачи (17.2), (17.69), а совокупность зна- 
чений коэффициентов с1,й ‚с, играет роль каркаса приближен- 
ного решения у„(х) на сетке х|,й , хи, что хорошо видно в ре- 
зультате подстановки х=х, в (17.70): 


1, Г=р, 
уи(х;) = Хе) в силу (5) = | г и 
1= $ , 


Во-вторых, при вычислении ненулевых элементов матрицы 
А= (а, } линейной системы (17.59) следует учитывать, что в фор- 
мулах (17.74)—(17.76) имеются одинаковые интегралы, что хотя 
бы незначительно сокращает затраты при численном интегриро- 
вании. 

В-третьих, в данном случае галёркинскую систему 
алгебраических уравнений (17.59), учитывая (17.73), удобно 
представить как краевую задачу для трехточечного разностного 
уравнения второго порядка, т.е. в виде 


ат + а1осо = 41, 
4; 1-16-1+ ас: +алиба=й; @=2й ,в-0, (7.77) 
Чип, п-1Си—1 + ЧииСи = Ян 


свидетельствующем о готовности системы к применению метода 
прогонки (2.23), (2.22). 

В-четвертых, при неоднородных краевых условиях 
первого рода 


у(а)=А, у()=В (17.78) 


можно воспользоваться описанным в $ 17.4 приемом сведения 
задачи (17.2), (17.78) к задаче 


Ци] = Е(), 
где 


Е(х) = Л(>) - вх) (х) - а )(х), у(х)=А+ 


В-А 
5“ -о), 


с однородными условиями 
и(а)=0, и(Ь)=0. 
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Найдя МКЭ ее приближенное решение 


и, (х) = Ус), 
получаем в 
2х) = уи(х) = ии(х) +). 


Пример 17.3. Рассмотрим фигурирующее в примерах 17.1, 17.2 
дифференциальное уравнение 


у -лу=-° 3, х=[1, 2] (17.79) 
х х 


при краевых условиях первого рода 
> =1, 5(2)=0.25. (17.80) 


1 
К этой задаче, имеющеи то же точное решение У(х) = —5° что ив 
Хх 


предыдущей задаче (17.55) для этого уравнения, применим метод конеч- 
ных элементов с двумя базисными функциями $1 и фо. 
Сначала выполним преобразование данной задачи к задаче с одно- 


родными условиями 


и"+х2и' - хи = Е(х), хе[ь?2], и()=0, и(2)=0, (17.81) 


для чего делаем замену у=иу, где 


+0251 _)-7_3,, 
2—1 4 
и, следовательно, 
6 637 
Е) =“ хуже -2+-х 
а Хх 54 Хх 4 
Введя на отрезке [1, 2] равномерную сетку 
4 5 
х=Ь мЕе> же, ж%=2 (17.82) 
0 175 273 3 
с шагом й= С записываем выражение приближенного решения зада- 
чи (17.81) ^ 


и2 (х) = с1 Ф1(х)+ со Ф(х), 
где 1 (х) и $>(х) — соответствующие сетке (17.82) функции-«крышки» 
(17.67). Для получения коэффициентов с1, со их линейной комбинации в 
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соответствии с (17.77) (при и=2) составляем линейную алгебраическую 


*) 


систему 


те +1262 =4, (17.83) 
а21С1 + 42262 = 4. 


За числовыми данными этой системы обращаемся к формулам (17.71), 
(17.74)—(17.76), согласно которым имеем: 


4, 4, 
Е 3 
аи =-6+9. [хх -+ | хх - 2% + 
1 1 


и 5[:-5) ® = 6.5926, 


реа 


р 
х? (х- 2) + (хх - 2) ах | = -6.1407, 
р 
3 


+ 


№4 


Е 

3 3 

аки 31 ЬЙ 
Я зи ий = 4 3 

3 


* 

) При таком малом числе базисных функций, разумеется, ни о ка- 
кой ленточной структуре матрицы этой системы не может быть и речи; 
здесь даже нет ни одного «полного» трехточечного уравнения. 
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В результате подстановки этих чисел в систему (17.83) находим 
с1 = -0.1976, со = -0.1456. 


Таким образом, приближенное решение у>2(х) данной задачи 
(17.79), (17.80) есть 


у2 (х) = у(х) + и> (х) = 1.75 - 0.75х - 0.19761 (х)- 0.14566 (х), 


где 


(17.84) 


Последнее можно преобразовать в канонический вид кусочно-линейной на 
отрезке [1, 2] функции 


2.3428 —1.3428х, если хе Ё = 


> 
[95] 
л 


у2 (х) = 31.3444 - 0.5940х, если хЕ В - , (17.85) 


0.8764 — 0.3132х, если хЕ В 2] 


Чтобы получить представление о точности найденного приближен- 
ного решения у>(х), сравним его значения с точными во внутренних уз- 


лах сетки и в середине заданного промежутка, что отразим следующей 
таблицей: 


ОСИ ПЕ: Е ЕН 
3 2 3 


52(%) | 0.5524 0.4534 0.3544 
5(х) 0.5625 0.4444 0.36 


Изображения базисных функций Ф1, ф› (штрихпунктирные линии), 
посредством которых методом конечных элементов получено кусочно- 
линейное приближение у>(х) к точному решению у(х) данной в примере 
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краевой задачи, и самих этих функций у>(х) и у(х) (штриховая и сплош- 
ная линии соответственно) представлены на рис. 17.6. 


0 


Рис. 17.6. Графики точного решения задачи (17.79)—(17.80), 
приближения к нему МКЭ (17.85) и базисных функций (17.84) 


Увеличив количество узлов и базисных функций на единицу, при- 
ходим к СЛАУ 
—8.4167с1 + 4.8333с. = 0.5992, 
2.937561 -8.5000с› +5.1875ез = 0.4578, 


2.5417с› -8.5833ез = 0.5020. 


Найдя из нее значения с1, со, сз, получаем приближенное решение 
уз(х) = 1.75 - 0.75х - 0.172561 (х) - 0.1806ф> (х)- 0.111043 (х) 


с базисными функциями $ф1, фо, фз, легко конкретизируемыми посредст- 


вом формулы (17.67) с учетом того, что узлами сетки в этом случае служат 
ТОЧКИ 


х0 =1, м =1.25, хо =1.5, хз =1.75, хд=2. 
Приближение уз(х) уже существенно точнее построенного выше при- 
ближения у>(х): его каркас на данной сетке совпадает с каркасом точного 
решения у(х) задачи (17.79), (17.80) во всех контролируемых здесь четы- 
рех десятичных знаках. 
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Замечание 17.7. Не касаясь особо вопросов, связанных со сходи- 
мостью и с точностью метода конечных элементов (доказано, что при оп- 


ределенных условиях можно считать ||у(х)-— у„(х)]|= 0? )}, представим 
себе возможность его развития за счет использования В-сплайнов поряд- 
ков, больше первого. Можно ожидать, что при таком повышении степени 
базисных функций будет повышаться точность приближенного решения с 
одновременным усложнением формул для подсчета коэффициентов ли- 
нейной алгебраической системы, сохраняющей ленточную структуру, но с 
увеличивающейся шириной ленты из ненулевых элементов. Имеются так- 
же модификации МКЭ, приспособленные к эффективному решению крае- 
вых задач для дифференциальных уравнений с заведомо разрывными ко- 
эффициентами; первые представления об этом можно получить из 
учебного пособия [3]. Подробное описание МКЭ содержится, например, в 
книге [168]. 


Замечание 17.8. Декларируемая в начале параграфа равномер- 
ность сетки, обеспечивающая одинаковость конечных элементов, коими 
в одномерном случае являются элементарные промежутки [х;_1,х; |, 
нужна была лишь для некоторого упрощения формул. Отказавшись от 
симметричности задания функции (1) в (17.66), без большого труда 


можно распространить все рассуждения и выкладки на произвольные сет- 
ки (с переменным шагом И; = х; —х,_1). 


УПРАЖНЕНИЯ 


17.1. Составьте алгоритм решения методом пристрелки (с точно- 
стью = > 0 удовлетворения правому краевому условию) краевой задачи: 


а) х? у" ш(х)-ху+у=0, хе[Ье], У@)=0, у(е)=е-2; 


бу-У, хе |,2], >%0)-=0, 2) =. 


17.2. К краевой задаче 
У-у=х, хЕ[0, |, 25(0)-у(0)=1, У(=2 


примените: а) метод редукции; 
6) метод дифференциальной прогонки. 


17.3. Запишите формулы, определяющие для краевой задачи 
(17.2)-(17.4) метод правой дифференциальной прогонки (см. замеча- 
ние 17.2). Примените их к решению задачи 


...8 3 
"+-У--у=--Ра, хе[2,4], у(2)=1, 5(4)-2у(4)=2. 
аи = [2,4], у(2)=1, ›(@)-2у(4) 
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17.4. Методом конечных разностей второго порядка составьте ал- 
гебраическую систему уравнений относительно значений решения крае- 
вой задачи 


+2" -з= 22, хЕ|, 2], У) =1, у(2)=0.5 (17.86) 


& 
на сетке с шагом й = 0.2. 


17.5. Дана краевая дифференциальная задача 


у-уш()-2у=1, хЕ[0.5, 1.5], 


(0.5) + (0.5) =1, у(.5)- у'(.5)=0. 


1) Аппроксимируйте ее разностной задачей с помощью МКР второ- 
го порядка на сетке с шагом Й = 0.125. Подготовьте полученную 
СЛАУ к прогонке. Можно ли гарантировать устойчивость про- 
гонки? 

2) Примените противопотоковый метод на той же сетке. 


17.6. Выполните конечноразностные аппроксимации краевой 
задачи 


у" + ру! +а(ду = Л(х), хе[а, В], Уа)=А, уУБ)=В 


третьего и четвертого порядков точности. Какие можно отметить достоин- 
ства и недостатки построенных разностных схем? Опробуйте схему чет- 
вертого порядка на задаче (17.86). 


17.7. Убедитесь в справедливости формул (17.51), (17.52) для под- 
счета параметров у; базисных функций (17.49), (17.50), опираясь на вто- 
рое из однородных краевых условий (17.41). 


17.8. Для краевой задачи (17.55) примера 17.1 (см. $ 17.4), исполь- 
зуя фигурирующие там функции фо и Ф|, методом коллокации найдите 
квадратичное приближение у (х), взяв за основу другой узел коллокации 
„ 9 «(З &17 Е 
Хх т Сравните значения у С У Е. и 1 (2) с соответствующими 


значениями точного решения у(х) и найденного в примере 17.1 коллока- 


г 3 
цией в узле х| = р приближенного решения у (х). 


17.9. Полагая Й = 0.25, примените к краевой задаче (17.86): 


а) метод коллокации со степенными базисными функциями; 
6) метод Галёркина с теми же базисными функциями. 


Сравните результаты в узлах сетки. 
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17.10. Выведите формулы для вычисления коэффициентов 
СЛАУ (17.58), к решению которой сводится применение метода Галёрки- 
на для дифференциального уравнения (17.65) с краевыми условиями пер- 
вого рода (17.7) (см. замечание 17.5). На их основе получите соответст- 
вующие формулы метода конечных элементов для этой задачи. 


17.11. Обобщите расчетные формулы метода конечных элементов 
так, чтобы они были пригодны для решения задачи (17.2), (17.78) в случае 
неравномерной сетки (см. замечание 17.8). 


17.12. Дана краевая задача 
(х+3)? у" + (2х+6)у'+0.25у=Мх+3, хЕ[0, 1, 


У(0)=0, у(=0.5. 


А) Примените метод конечных элементов с одной, с двумя и с тремя 
базисными функциями на равномерной сетке. Сравните сеточные значе- 
ния найденных приближений у|(х), у2(х), уз(х) и точного решения 


У(х) = х/Мх+3. 


Б) В случае единственного внутреннего узла (одной базисной функ- 
ции) опробуйте результаты выполнения упр.17.11, принимая за этот узел 


1 2 
поочередно точки З и З и сравнивая полученные приближения между 


собой ис у|(х) из п. А). 
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ЧИСЛЕННОЕ РЕШЕНИЕ . 
ИНТЕГРАЛЬНЫХ УРАВНЕНИИ 


Даются некоторые общие понятия об интегральных урав- 
нениях, в частности, о линейных уравнениях Фредгольма и 
Вольтерра. Описывается способ решения интегральных уравне- 
ний частного вида, известный как метод вырожденных ядер. 
Основное внимание уделяется численному решению уравнений 
методом конечных сумм, базирующемуся на использовании тех 
или иных квадратурных формул. Такой достаточно универсаль- 
ный метод позволяет сводить данную задачу в функционально- 
интегральной постановке к решению линейной алгебраической 
системы относительно каркаса приближенного решения: с 
квадратной матрицей коэффициентов в случае уравнений Фред- 
гольма и с треугольной — для уравнений Вольтерра. Изложение 
сопровождается численными примерами. Последний параграф 
главы посвящен квадратурно-итерационному методу вычисле- 
ния каркаса резольвенты. Этот метод опирается на дискрети- 
зацию (на квадратурной основе) известной связи между резоль- 
вентой и ядром уравнения второго рода с последующим 
применением итерационного процесса Шульца. 


ГЛАВА 18 


18.1. НЕКОТОРЫЕ ОБЩИЕ СВЕДЕНИЯ 
ОБ ИНТЕГРАЛЬНЫХ УРАВНЕНИЯХ”) 


Интегральным уравнением называют уравнение относи- 
тельно неизвестной функции, содержащейся под знаком инте- 
грала. С частными интегральными уравнениями мы уже встреча- 
лись в главах 14, 15, преобразуя к интегральной форме задачу 
Коши для дифференциального уравнения (см. (14.3), (15.53)). 

К интегральным уравнениям приводят многие задачи, воз- 
никающие и в самой математике, и в многочисленных ее прило- 
жениях. Исторически первой задачей, оформленной как инте- 
гральное уравнение 


И и = (2), (18.1) 
0%2—й 
считается задача Абеля (1823 г.), заключающаяся в определении 
вида кривой х = $(2), по которой в вертикальной плоскости Ох2 
под действием силы тяжести скатывается материальная точка 
так, чтобы начав свое движение без начальной скорости в точке 


* 
) Более подробно см. в источниках [41, 77, 95, 109, 110, 116, 130, 
190 и др.] 
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кривой с аппликатой 2, она достигала оси Ох за заданное время 
Т= (а). 

Другим примером может служить описание зависимостей 
между напряжениями с’ и деформациями = упруго-вязких мате- 
риалов уравнениями 


=(#) = ит ЕК дот (18.2) 
0(!)= Е=(|)- Е [т Т((- г)=(г)ат, (18.3) 
0 
где Е — модуль упругости, КС — 2) — функция влияния на- 


пряжения о(!) в момент т на деформацию =(!) в момент 1, 
Т({ - т) — аналогичная функция влияния деформации. 

Основанием для составления уравнений обычно служат 
общие физические (в широком смысле) законы. Известные зако- 
ны сохранения массы, импульса, энергии имеют интегральную 
формулировку и приводят к интегральным уравнениям. Инте- 
гральными уравнениями отражаются законы газовой динамики, 
электродинамики, экологии и т.д. Достоинством таких моделей 
служит то обстоятельство, что интегральные уравнения, в отли- 
чие от дифференциальных, не содержат производных искомой 
функции, а значит, не накладывают жестких ограничений на 
гладкость решения. 

Достаточно общий вид интегральных уравнений содержит- 
ся в записи 


х(1) = [ КС, 5, х(5))4 + Г, (18.4) 
р 


где р — некоторая область и-мерного пространства, х — неиз- 
вестная, а Г — известная векторные функции; К — в общем 
случае нелинейная относительно х функция. 

Ограничимся рассмотрением лишь одномерных уравнений, 
т.е. таких, в которых искомой неизвестной является скалярная 
функция одной переменной и интегрирование производится по 
отрезку. При этом будем иметь в виду только интеграл Римана, 
хотя часто для большей общности интегральные уравнения изу- 
чаются с привлечением интеграла Лебега. Более того, наше вни- 
мание не выйдет за рамки линейных интегральных уравнений, 
т.е. таких уравнений (18.4), в которых т аиы функция 
КО. Е >) представима в виде О(+, 5)х(5). 

Опишем основные типы линейных интегральных уравне- 
ний. По тому, постоянны ли обе границы интегрирования или 
одна из них может быть переменной, линейные интегральные 
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уравнения подразделяются на уравнения Фредгольма и уравне- 
# 


ния Вольтерра соответственно ). Более простыми (с более хоро- 
шими свойствами) и более широко применяемыми являются 
линейные интегральные уравнения второго рода: 


Фредгольма — 
Ь 
х() = АГО(Ь, $) х (5) + (0) (18.5) 
а 
и Вольтерра — 
1 
х() = АГО(Ь, $) х (5) + ГО. (18.6) 
а 
Заданная функция /(Г) — свободный член — и неизвестная 


функция х(Г) — решение — в этих уравнениях зависят от пере- 
менной /, изменяющейся на отрезке [а, 5]. Функция двух пере- 
менных О(Е, 5), называемая ядром интегрального уравнения, оп- 
ределяется на множестве точек квадрата [а, Б]х [а, 6] в случае 


интегрального уравнения Фредгольма (рис.18.1а) и треугольника 
а<5</(<Ь вслучае уравнения Вольтерра (рис.18.16). 


а) 6) 
Рис.18.1. Области задания ядер О(Е,5) интегральных уравнений 
Фредгольма (а) и Вольтерра (6) 


*) Фредгольм Эрик Ивар (1866-1927) — шведский математик; 
Вольтерра Вито (1860—1940) — итальянский математик. Устоявшееся в 
течение многих лет русское написание «уравнение Вольтерра» все чаще 
сменяется написанием «уравнение Вольтерры». Отдадим дань традиции в 
ущерб правописанию. 
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Сразу заметим, что доопределив ядро О(1, 5) уравнения 
Вольтерра нулем при а<1#< 5 <Ь (в нештрихованной части квад- 
рата [а, Ь]х [а, Ь] на рис.18.16), уравнение Вольтерра можно по- 
считать уравнением Фредгольма и применять к нему известные 
для уравнений Фредгольма результаты. Однако при таком под- 
ходе теряется специфика уравнений Вольтерра, и возникают 
сложности, которых можно избежать при раздельном изучении 


этих уравнений 

Введение в линейное интегральное уравнение числового 
параметра ЛД (который можно отнести и к ядру) придает уравне- 
нию более общий вид и позволяет установить теоремы сущест- 
вования решений при тех или иных значениях &, в то время как 
при нейтральном значении ЯД =1 решения может не оказаться. 
Подобно тому, как это делается в теориях линейных систем 
алгебраических или линейных дифференциальных уравнений, 
существование и единственность решений линейных неодно- 
родных уравнений (18.5), (18.6) изучается посредством изуче- 
ния соответствующих им однородных уравнений, т.е. урав- 
нений, получающихся из (18.5), (18.6) при (1) = 0. 

Более сложно обстоит дело с существованием решений, их 
единственностью и непрерывной зависимостью решений от пра- 
вой части для интегральных уравнений первого рода: 

Фредгольма — 


|0, 5)х(5) 4 
и Вольтерра ыы 
Го, зе: = 7. (18.8) 


Такие уравнения, характеризующиеся отсутствием отдель- 
ного слагаемого х(г) (не связанного интегралом), имеют более 
ограниченную сферу применения и являются наиболее типич- 
ными представителями некорректных задач (см. $ 1.7). Особен- 
но это касается уравнений Фредгольма (18.7), в которых, кстати, 
иногда считают, что независимая переменная / изменяется не на 
промежутке интегрирования [а, Ь], а на некотором другом отрез- 


(0) (18.7) 


ЕЗ 

) Выше уже отмечалась связь между задачами Коши для диффе- 
ренциальных уравнений и интегральными уравнениями с переменными 
верхними границами, относящимися к уравнениям Вольтерра. Аналогич- 
но, интегральные уравнения Фредгольма связывают с краевыми задачами 
для дифференциальных уравнений. Отсюда может проистекать понима- 
ние, например, того, насколько жестче стоит вопрос о разрешимости 
уравнения Фредгольма по сравнению с разрешимостью уравнения Воль- 
терра. 
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ке [с, 4], где с=а+б|, 4=Ь+до, т.е. ядро О(Е, 5) задается на 
прямоугольнике [с, 4]х [а, Ь]. 

Уравнения первого и второго рода можно объединить об- 
щей записью 


в(1)х() = А | О(Ь, $)х(5) 65 + 10. (18.9) 
р 


При й(г) = 0 формула (18.9) определяет уравнение первого рода, 
при й(г) =1 — второго рода; если же (Г) обращается в нуль в 
некоторых точках промежутка интегрирования Д, то (18.9) есть 
уравнение третьего рода, более редко встречающееся в прило- 
жениях и менее изученное. 

Очень многие используемые на практике уравнения выде- 
ляются тем, что их ядра зависят только от разности {-5. Такие 
интегральные уравнения называют уравнениями с разностным 
ядром. К ним, очевидно, относятся приведенные в начале пара- 
графа конкретные интегральные уравнения Вольтерра (18.1)- 
(18.3) (первое из них — уравнение первого рода, второе и третье 
— второго рода). 


При непрерывных функциях О(,5) и /(г) достаточно про- 
сто устанавливается существование единственного непрерывно- 
го решения х(Г) уравнения Вольтерра второго рода (18.6) при 
любых значениях параметра А; отсюда — несущественность 
его введения в эти уравнения. Для уравнений Фредгольма второ- 
го рода (18.5) при тех же требованиях непрерывности О(Е, 5) и 
(6) существование единственного непрерывного решения мож- 
но установить, например, при условии, что 


1 
Я<———, ге С:= шах иж). 18.10 
| | С(Ф-а) ‚ва $) ( ) 


При снижении требований к гладкости возможных решений ус- 
ловие (18.10) ослабляется. Например, в случае функций, интег- 
рируемых с квадратом, в роли достаточного условия вместо 
(18.10) часто фигурирует неравенство 


И|< | 


Я | 
Го (1, 5) 44 
аа 
Для некоторых уравнений второго рода с ядрами опреде- 
ленной структуры имеются формулы (или совокупности фор- 
мул), позволяющие найти точное решение х(!). 
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Так, например, изучение уравнения Вольтерра (18.6) с д =1 
и мультипликативным ядром 


ОС, 5) = 2095) 


приводит к решению 


| 
х(®) = ка, 5) 1(5)4 + Г@®) (18.11) 
а 
с функцией А(Е, 5), подсчитываемой по формуле 
Гаем 
КСЕ, 5) = 20 4($) е* (18.12) 


Решение уравнения Фредгольма (18.5) с вырожденным 
ядром 


О, 5) = Урда, (8) (18.13) 
= 
имеет вид 


т 
х( =1>, 2, РКО + ГО, (18.14) 
1=1 
где числа 2; должны быть решениями системы линейных алгеб- 
раических уравнений 
21 — 451121 — 461222 -Й — ЯСт2т = 41, 
22 — 162121 — 162222 _р — Я = 42, 


(18.15) 
2т — Ст 21 сы ЯСт222 -й — ЯСбтт2т = Чт, 
в которой 
Ь Ь 
су = [ар ; (5), а; = [4:$).1($)4%. (18.16) 
а а 


Очевидно, существование единственного решения (18.14) урав- 
нения (18.5) с ядром (18.13) напрямую связано с однозначной 
разрешимостью СЛАУ (18.15), т.е. с отличием от нуля определи- 
теля 0(Й) этой системы (называемого определителем Фред- 
гольма). 


660 


Пример 18.1. [96]. Рассмотрим уравнение 


х(и) = ИЕ — 5)х(5) 4$ + с0$(1), 
0 


являющееся линейным интегральным уравнением Фредгольма второго 
рода. Его разностное ядро зш(!-5) по формуле синуса разности можно 
преобразовать к вырожденному: 


$т(Ё-— 5) = $1 #с0$ 5 — с0$ [51 5. 


Сопоставляя это с (18.13), видим, что если данное уравнение имеет реше- 
ние, то его следует искать в соответствующей (18.14) форме: 


х(И) = А2|3Ш!- 122 60$Ё+ 6051. (18.17) 


По формулам (18.16) вычисляем: 


д | я 2 п 

си = [со55зт5 6 =0, С]2 = — [соз 5%=-——, 
0 0 2 
п. п й 

22] = [502546 =—, 622 = — [51156055 65 =0, 
о 2 о 
т л т. 

а = [05° =7, 4> = [3155055 4 =0. 
0 0 


Составив систему вида (18.15) 


аа 

о ра» 
п 

— 21 +22 =0 
5 И +20 

И ВЫЧИСЛИВ определитель Фредгольма 
т 2_2 
= 9: | _ Я 7/9 
(д) = | дл =1+ д’ 

2 


убеждаемся, что он отличен от нуля при любых вещественных значениях 
и, значит, решение (18.17) существует и единственно. Найдя еще опре- 
делители 
2 
п яп 
В (Я) =—, 25(4) ==, 
2 4 


по формулам Крамера записываем значения коэффициентов 
_ 27 _ дл? 
м в 

4+2? 


21 ии 
4+142л? 
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подстановка которых в выражение (18.17) приводит к решению 
4с0$1+ 247 5т/ 
=— УЛЕБ. 


х(1 
ыы 4+12л? 

Умение находить точное решение интегрального уравнения 
с вырожденным ядром порождает приближенный метод, в осно- 
ве которого лежит замена одного уравнения другим, ядро кото- 
рого вырожденно и в каком-то определенном смысле близко к 
данному. Такая замена ядра вырожденным может опираться на 
разные способы локальной аппроксимации функции двух пере- 

менных. 


Например, уравнение 


0.5 
х(1) = [191(15) х(5) 4 + с0$ 0.51 (18.18) 
0 


с определенной степенью точности (которую доступно оценить) можно 
заменить уравнением с вырожденным ядром 


0.5 
х(и) = [1252(5) + с0$ 0.51 , (18.19) 
0 


пользуясь тем, что по формуле Тейлора при малых 15 имеет место при- 
ближенное равенство 


$1(65) = 8 +0((65)3). (18.20) 


Кроме вышеупомянутого метода замены ядра на вырож- 
денное, имеется ряд других приближенно-аналитических мето- 
дов решения интегральных уравнений. Из них отметим методы, 
тесно примыкающие к аналогичным методам решения диффе- 
ренциальных уравнений. Например, сродни рассмотренному в 
$ 14.1 методу Пикара решения задачи Коши является метод по- 
следовательных приближений для интегральных уравнений; 
аналогом метода Галеркина решения краевой задачи (см. $ 7.5) 
служит метод моментов. Описание этих и других приближенных 
методов можно найти в книгах [20, 41, 62, 81, 100, 116, 126, 162]. 

Наиболее универсальными и хорошо приспособленными 
для компьютерных вычислений являются численные методы 
решения интегральных уравнений. Их построение опирается на 
замену интеграла в интегральном уравнении конечной суммой на 
базе какой-либо квадратурной формулы, в результате чего задача 
сводится к алгебраической системе относительно дискретных 
значений (каркаса) искомого решения, соответствующих 
заданным или определяемых выбором квадратурной формулы 
значениям аргумента (сетке). Такие методы называются квадра- 
турными методами или методами конечных сумм. Они 
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чрезвычайно просты как в идее, так и в реализации, причем без 
каких-либо изменений их можно применить и к нелинейным ин- 
тегральным уравнениям, имея лишь в виду, что в этом случае и 
системы конечномерных уравнений, к которым будет приводить 
дискретизация, также будут нелинейными. 

Рассмотрению техники и особенностей применения метода 
конечных сумм к линейным интегральным уравнениям Фрелд- 
гольма и Вольтерра посвящены следующие два параграфа. 


18.2. КВАДРАТУРНЫЙ МЕТОД РЕШЕНИЯ 
ИНТЕГРАЛЬНЫХ УРАВНЕНИЙ ФРЕДГОЛЬМА 


Пусть для вычисления определенного интеграла использу- 
ется некая конкретная квадратурная формула 


Ь п 

[2(5)6 = У А;Ф($ у) (18.21) 
а 1=1 

с п узлами 5; е [а,В] и с соответствующими им весовыми коэф- 

фициентами А; (см. гл.12). 


Подставим правую часть приближенного равенства (18.21) 
с 9(5) = Обь $) вместо интеграла в интегральное уравнение 
Фредгольма второго рода (18.5). В результате этого получаем 


п 
х = АУ АО, $1)х(5) + Г) (18.22) 

1= 
— приближенное представление решения х(г) уравнения (18.5) 
через и его значений х(51), х(5>), й , х(5„). Чтобы вычислить 
эти значения, станем рассматривать равенство (18.22) не при 
всех Ге [а, В], а лишь на системе точек (|, (2, Й , (,, совпадаю- 


щих соответственно с узлами $1, 52, Й ‚, 5„ квадратурной фор- 
мулы (18.21). Таким образом, приходим к и равенствам вида 


Жи) = АУ АО,» 51); + Г, (18.23) 
= 


где 1=1,2,й ‚пи. 


Положим для краткости 


{@ = О(,, 5), Ё. — Г(;), х; = Эа) х(5;)). (18.24) 
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Тогда (18.23) преобразуется к системе и линейных алгебраиче- 
ских уравнений с и неизвестными, которая выглядит следую- 
щим образом: 


(1- АО) — #42О12х2 -Й -— АА, Ошх, = д, 
— АА Озлж + (1- 44052 )хо —й — АА, Оихи = №, (18.25) 


ый АО тм = АА Опох> = * (1 -- Я О я )х = Г . 


Стандартная запись линейной системы (18.25), с одной стороны, 
говорит о возможности ее решения тем или иным стандартным 
методом, если она совместна, с другой стороны, высвечивает 
роль параметра Л в однозначной разрешимости этой системы 
(и, как следствие, с некоторыми оговорками, интегрального 
уравнения (18.5)): при любых фиксированных А;, О’; за счет 
уменьшения модуля параметра А можно добиться диагонального 
преобладания в матрице системы, влекущего выполнимость ус- 
ловий сходимости метода простых итераций в форме Якоби 5 3.2. 

Найдя решение системы (18.25), получаем и чисел 
х1, х2,й , х„, — каркас приближенного решения интегрального 
уравнения на сетке { = 1; (1=1,2,й ‚п). Если нам только и нуж- 
на эта таблица приближенных значений решения интегрального 
уравнения (18.5) в точках Ц, (2, Й , („, то в такой постановке за- 
дача решена. Если же нужны значения решения в других точках 
ГЕ [а, Б] или требуется знать решение х(г) в аналитическом ви- 
де, подставляем найденные значения х; = х(5;) (Л=Ъ2,й ‚и) 
в равенство (18.22) или аппроксимируем их, привлекая для этих 
целей, например, интерполяцию, если и мало, или сплайн- 
интерполяцию при больших и; в некоторых случаях здесь может 
оказаться полезным и метод наименьших квадратов. 

Точность численного решения интегрального уравнения 
квадратурным методом зависит от нескольких взаимосвязанных 
факторов: применяемой квадратурной формулы, количества ис- 
пользуемых узлов, свойств определяющих уравнение функций. 
Имеются неравенства, позволяющие, в принципе, оценить мак- 
симальное расхождение между точными и приближенными ре- 
шениями при различных применяемых квадратурах (18.21) 
(см., например, [20, 41, 81, 100]); однако эти оценки малопри- 
годны в рядовых ситуациях ввиду громоздкости, что, в конечном 
итоге, отражается на их точности. Более практичным, хотя и не- 
достаточно строгим способом контроля точности подсчитывае- 
мого методом квадратур каркаса решения, может служить уже 
использовавшийся ранее (см. $$ 12.5, 13.2, 14.7) принцип Рунге 
сравнения значений приближенных решений в общих узлах двух 
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разных сеток, используемых в квадратурной формуле. Разумеет- 
ся, при таком способе контроля точности приходится ограничи- 
ваться квадратурными формулами, опирающимися на равномер- 
ные сетки, или привлекать для сравнения результатов 
применения, например, формул Гаусса или Чебышева другие 
каркасы, подсчитывая значения приближенных решений в каких- 
то точках Ее [а, Ь], отличных от узловых, по формуле (18.22). 
При выборе конкретной квадратурной формулы (18.21) для 
использования в методе конечных сумм важно понимать, что 
лучшие результаты могут быть получены в том случае, когда ее 
алгебраический порядок точности хорошо согласуется со степе- 
нью гладкости ядра и свободного члена интегрального уравнения 
(предопределяющих гладкость искомого решения). Если ядро и 
свободный член не являются достаточно гладкими, то для дис- 
кретизации интегрального уравнения не следует применять вы- 
сокоточных квадратур, а лучше ограничиться такими квадратур- 
ными формулами, как формулы трапеций или прямоугольников. 


Пример 18.2. Дано уравнение 


2) = | р ++ (18.26) 
1+ 52 
К этому интегральному уравнению Фредгольма второго рода применим 
метод конечных сумм на основе квадратурной формулы Гаусса с двумя 
узлами (учитываем, что на отрезке 1,2] с гладкостью определяющих 
уравнение функций проблем нет). В соответствии с формулой (12.52) и 
табл.12.3 при и = 2 имеем 


2 1 3—0.577350 3+0.577350 
Е и | 
| 


2 2 2 
х(5) 
Используем это приближенное равенство в (18.26) с (5) = РЕ При- 
1+5 
ходим к приближенному представлению данного уравнения в виде 
ба х(1.211325) й х(1.788675) РЕВ 4+1. (1827) 


2\/1+1.211325? 2\1+1.7886752 
Полагая здесь аргумент { равным узловым значениям (| = 1.211325 и 
15 = 1.788675 (к которым мы пришли от узлов + 0.577350 в результате со- 
поставления стандартного промежутка интегрирования | с данным 
промежутком Й, 2]), получаем линейную систему 


0.694498 х; —0.238077х› = 0.415545, 
—0.277095х\ +0.776125х› = 1.052641 
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типа системы (18.25) относительно неизвестных х| = х(И), хо = х(45). 
Решив эту систему, находим каркас приближенного решения 


х! = 1.2116, хо = 1.7888. 


Восполнение этого каркаса по формуле (18.27) приводит к аналитическо- 
му виду приближенного решения уравнения (18.26) 


г 0.6058 0.8944 
ое +1—4/2+44+1. 
\1+1.4673 \4+3.1994 


Чтобы получить представление о точности полученного прибли- 
женного решения, сравним его с известным точным решением х(г) =Е в 
узлах сетки (т.е. сравним каркасы, определяемые выбранной квадратурной 
формулой), а также в точках, служащих концами и серединой промежутка 
интегрирования (каркасы, представляющие потенциальный интерес). Ре- 
зультаты сравнения отражены следующей таблицей: 


г вре р | 


В случае применения простейшей формулы Симпсона (12.19), опи- 
рающейся здесь на узлы Ц =1, {2 =1.5, (3 =2, приходим к представле- 
нию решения 


1, 420.5) х0) 
о, учтен 


и соответственно к линейной алгебраической системе 


0.88215 х, — 036980. — 0.07454х3 = 017815, 
- 010541х, + 0.65574 х› — 0.07107х3 = 0.73593, 
- 0.09623 х, — 0.32338х> + 0.93196х = 1.28256. 


Ее решение дает значения 
х| я 0.9996, хо = 1.4997, хз = 1.9998, 


также являющиеся достаточно хорошими приближениями к точным зна- 
чениям х(1) =1, х(1.5) = 1.5, х(2)=2. 


Замечание 18.1. При численном решении интегральных уравне- 
ний с разрывными ядрами или с бесконечными границами интегрирования 
следует вспомнить о наличии специально приспособленных для таких 
случаев квадратурных формул Гаусса-Кристоффеля, описанию которых 
посвящен $ 12.7. Сделав правильный выбор квадратурной формулы из 
указанного семейства, все остальное можно выполнять по рассмотренной 
выше схеме. 
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Формально к интегральному уравнению Фредгольма 
первого рода (18.7) можно попытаться применить тот же метод 
конечных сумм, но результаты такого непосредственного пере- 
хода к квадратурам могут оказаться весьма неудовлетворитель- 
ными из-за уже упоминавшейся в предыдущем параграфе некор- 
ректности этих уравнений. Поэтому прежде, чем осуществлять 
дискретизацию уравнения первого рода с помощью каких-либо 
квадратурных формул, производят его регуляризацию. Наиболее 
типичные предположения, в которых это делается, следующие. 

Само уравнение рассматривается в записи 


Ь 
ГО, хз) = РФ, 1в[с, 4], 


подчеркивающей тот факт, что промежуток изменения перемен- 
ной { в общем случае может не совпадать с промежутком интег- 
рирования (а это означает неквадратность матрицы коэффициен- 
тов СЛАУ, если сразу приступить к дискретизации этого 
уравнения). Ядро 0(1,5) уравнения предполагается непрерыв- 
ным в прямоугольнике [с, 4]х[а, 6], и считается, что вместо него 


известно близкое ему ядро О((, 5); их близость задается неравен- 
ством 


|0@, 5-04, |<. 
Аналогично, вместо (Е) Е [5[с, 4] считается известной функция 
7) = 1(@®), причем 
|7©- 7@]55. 


Относительно искомого решения х(5) делается предположение, 
что при 5 Е[а, 6] оно должно иметь почти всюду производную 
х'(5), интегрируемую с квадратом, и при этом х’(а) = х'(Ь) = 0. 

В указанных предположениях схема получения каркаса ре- 
гуляризированного решения такова. 

Данное уравнение заменяется уравнением 


Ь 
Ах:= ГОС, 5)х(5) 4 = 1(0), 1Е[с, 4]. 
а 
По этому интегральному оператору А и функции 1, согласно 


методу а-регуляризации Тихонова (см. $ 1.7), строится функ- 
иионал Тихонова 


р 
Фи [х, 1] = [(4х- 0)? м+а0, 
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где стабилизирующий функционал часто берется в виде 


Ь 
об = [(?(5)+46'6))? 
а 
содержащем дополнительный параметр 4>0; при значении 
4=0 говорят о регуляризации нулевого порядка, при а>0 — 
первого порядка. Из условия минимума функционала Ф„[х, 7] 
составляется уравнение Тихонова (сравните с (1.31)) 


Ь 
а(хи (и) — ахи, (и)) + | К(и, з)хи (5) = Е(и), ив[а, В], 
где 


а — — 
К(и, 5) = [О@, Ой, 5) (=К(5, и)), 


а 
Е(и) = ба, ) Фа, 


х„(и) — искомое регуляризованное решение такое, что 
7’ 
х»(а)=0, х„(Ь)=0. 


Полученное интегро-дифференциальное уравнение (интеграль- 
ное уравнение второго рода в случае 4 =0) далее дискретизиру- 
ется с помощью каких-либо квадратурных формул невысокого 
порядка точности; чаще всего здесь используется формула тра- 
пеций. После этого включаются непростые механизмы подбора 
оптимальных в каком-то смысле значений параметра регуляри- 
зации а, связанных с заданными значениями уровней погреш- 
ностей & и д ядра и свободного члена. Подбор © завязан на 
многократном решении СЛАУ вида 


(&С+С)хь =Е 
с симметричной положительно определенной матрицей «С+С 


* 
(матрица С — ленточная, при 4 = 0 — скалярная) ). 

Конкретные формулы, алгоритмы, программы и примеры, 
отражающие применение методов регуляризации к интеграль- 
ным уравнениям, можно найти, например, в книге [41]. 


* 

) В некоторых случаях симметризацию выполняют искусственно, 
умножая уравнения, получаемые в процессе дискретизации, на постоян- 
ные множители, определяемые шагами дискретизации. 
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18.3. КВАДРАТУРНЫЙ МЕТОД РЕШЕНИЯ 
ИНТЕГРАЛЬНЫХ УРАВНЕНИЙ ВОЛЬТЕРРА 


Выше отмечалось, что параметр А в линейных интеграль- 
ных уравнениях Вольтерра не несет такой нагрузки, как в случае 
уравнений Фредгольма. Поэтому положим в уравнении (18.6) 
Я = 1 и будем численно решать уравнение 


(р) = о, 5)х(5)4$ + 7(Г), ГЕ[а, В]. (18.28) 


Учитывая, что это уравнение формально можно считать уравне- 
нием Фредгольма вида 


Ь 
х(г) = [ КС, 5)х(5)4 + Г) (18.29) 
с ядром 
Ка | 5) при а<5<1<Ь, (1830) 
0 при а<1<5 <Ь, 


ДЛЯ приближенного представления его решения 
п 
ж) = > 4,0 (8) + (1831) 
1= 


на основе квадратурной формулы с узлами 5, е [а, Ь] и весами 
А; можно воспользоваться результатами предыдущего парагра- 
фа. Согласно им, для получения каркаса ху, хо›,Й , х„ прибли- 
женного решения (18.31) нужно составить систему линейных ал- 
гебраических уравнений типа системы (18.25), которая 
применительно к уравнению (18.29), в силу (18.30), превращается 
в треугольную: 
(- АО = ЛЬ 
— АО +(1- 42022 )х2 = Ло, (18.32) 


—АОтжм —А2Онохо —й +И-АОт)хи = в. 
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Отсюда легко получаем последовательно один за другим иско- 
мые значения х|, х2,Й ‚х„, полагая 1 =1,2,Й ‚п в формуле 


1-1 

Л+ > А,Оух) 

а ВЕ (18.33) 
1- 4:0 

Применение такого формального подхода к численному 
решению уравнений Вольтерра имеет некоторые нюансы. Чтобы 
не разбираться с ними на этой стадии решения рассматриваемой 
задачи, проще заняться процессом дискретизации интегрального 
уравнения (18.28) с самого начала. При этом, учитывая, что точ- 
ка Ь, ограничивающая промежуток определения решения х(!), в 
уравнениях Вольтерра присутствует лишь номинально (как мы 
помним, эти уравнения родственны начальным задачам 
для ОДУ), то при их дискретизации лучше изменить очередность 
фиксирования переменных / и 5 по сравнению с тем, как это де- 

лалось в случае уравнений Фредгольма. 
Будем придавать аргументу / в уравнении (18.28) возрас- 
тающие значения (|, (2, й ‚ „Е [а, 6]. Получим и интегральных 

равенств 


Г, 
х(и,) = ГО, 5$)х(5)ф + Га), (18.34) 


промежутки интегрирования в которых при каждом Г теперь по- 
стоянны и увеличиваются с ростом {Г на величину шага 
й; =1, —1; 1. Заменив определенные интегралы в (18.34) конеч- 
ными суммами 


ы АО, 5) ($) (18.35) 
р 


.* 
с переменным числом узлов, равным 1 ), приходим к 
приближенным равенствам 


хи) = УХА, $1) у) + Ла. (18.36) 
= 


Если, как и прежде, при любых Ге {1,2,Й ‚и! 
= и хх), 


то (18.36) определяет линейную алгебраическую систему 


* 

) Что можно отразить введением второго индекса в обозначение ве- 
сового коэффициента квадратурной формулы, т.е. всюду в пределах этого 
параграфа есть смысл использовать Ау, в роли А.. 
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1 
х = > А,Оух,+Л, и. Я (18.37) 
= 


в точности совпадающую с формально выписанной выше систе- 
мой (18.32). 

Из последних рассуждений, в частности, вытекает понима- 
ние того, что совокупность всех весовых коэффициентов А; в 


каждой строке системы (18.32) должна быть полной для вы- 


бранной квадратурной формулы, т.е. при каждом 1=12,й ‚п 
должно иметь место равенство 
1 
ра А; = Г = 
р 


При конкретизации вида квадратурной формулы для заме- 
ны определенных интегралов в равенствах (18.34) конечными 
суммами (18.35) предпочтение здесь отдается формулам замк- 
нутого типа, например, квадратурной формуле трапеций (не 
обязательно с постоянным шагом й;). В таком случае при Ц =а 
из (18.34) сразу следует 


м=Л (=/@). 
ь 


| 
Далее, при 1=2 к интегралу |= | в (18.34) применяется про- 


а 1 
стейшая формула трапеций (12.17), в результате чего получаем 
второе уравнение системы (18.37): 


В = 
хо = = (О21м + О22х2) + Л. 


в В 
К следующему интегралу | = | применяется уже составная 
ай 
формула трапеций (12.28), которая в более простом варианте с 
постоянным шагом й = 1; — {;_1 приводит к уравнению 


й й 
хз = 2 9319 + ЙОз2х> тожа + 
и так далее. Таким образом, в случае использования квадратур- 


ной формулы трапеций с постоянным шагом Й=1-1;_| 
(1=2,3,Й ‚п) треугольная система для получения каркаса 
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х1, х2,й , х„ приближенного решения линейного интегрального 
* 
уравнения Вольтерра второго рода (18.28) приобретает вид ) 


м=лЛ, 

й й 

= +| 1=— =, 
52 оз № 
й 


й 
2 9 —ПОз2 хо +( — 8 } = Л, 
(18.38) 


й 
—> им —ПОнохо -—Й —ПОзн Хи + 


+ (1 0» )хи = Ли. 


Нет никакой необходимости собирать сразу все требуемые для 
построения каркаса решения уравнения в систему, целесообраз- 
нее поочередно записывать их и по ходу разрешать относительно 
соответствующего неизвестного или просто последовательно 
пользоваться формулой для вычислений неизвестных хо, хз, й 
типа формулы (18.33). 


Пример 18.3. Дано интегральное уравнение Вольтерра второго рода 


1 
х(р) = [16057 (153 )х(5) 46 +1? -8 4) (18.39) 
0 
Применим к нему квадратурную формулу трапеций с шагом й = 0.1, ис- 
пользуя четыре узла: 


Н=51 = 0, 2 = 52 = 0.1, 3 = 53 = 0.2, 4 =54 =\03. 


В соответствии с этой сеткой, рис.18.2, и видом отвечающих данному 
случаю уравнений (18.38) имеем: 


ж = /(0)=0, 


0.01 -е 0.0001 


х) = 0.010017, 


10.005: соз? 0.0001 
* 
) В случае переменного шага ее вид незначительно сложнее. 
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0.04 — те 0.0016 + 0.02 соз? 0.0002. 0.010017 


о ДИ топи -_ 0.040068, 
1-0.01со$7 0.0016 


0.09 — 10.0081 +0.03соз? 0.0003.0.010017 
ха я я ее 
1- 0.015 со5- 0.0081 


р 0.03соз? 0.0024.0.040068 


= 0.090155. 
1 0.015 оз? 0.0081 


0 0.1 0.2 0.3 5 


Рис. 18.2. Узлы и промежутки последовательного интегрирования 


при численном решении уравнения (18.39) методом трапеций 
с шагом й=0.1 


Полученные значения х|, хо, хз, хд хорошо согласуются с соответствую- 
щими значениями х(0), х(0.1), х(0.2), х(0.3) точного решения данного 


уравнения (18.39) х(1) = 2. При этом замечаем, что с удалением от точки 
а = 0 точек 1; — фиксированных верхних границ интегрирования в выра- 
жениях вида (18.34) — точность уменьшается, что характерно и при чис- 
ленном нахождении решений задач Коши для ОДУ с постоянным шагом 
при удалении от начальной точки. Так как перемена очередности фикси- 
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рования переменных / и 5 в интегральном уравнении Вольтерра лишила 
нас аналитического представления приближенного решения через его кар- 
кас типа представления (18.22), применим лагранжеву интерполяцию. Со- 
ставим по найденным числам х|, хо, Хз, хд — приближенным значениям 


решения х(Г) — таблицу конечных разностей: 


0.010017 
010017 0.020034 
0.910017 | 0.030051 0.000002 


0.020036 
0.040068 0.050087 


0.090155 


Вторые разности в ней практически совпадают, поэтому следует ограни- 
читься квадратичной интерполяцией. Взяв за основу первые три узла, по 
первой формуле Ньютона (8.25) получаем 


Ах А2х 
х(1) = Р()=Х +. 0+2 )&-15)= 


т ЕЯ 
0.1 2.0.01 


По трем следующим узлам (15, (3, (4) аналогично находим 


х(г) = Р, (0) = 1.00181? — 0.000031 + 0.000002. 


И то, и другое выражения могут служить неплохими аппроксимациями 
точного решения х(Г). Можно рассчитывать на лучшие результаты, если 
рассматривать сетку с более мелким шагом й. 


Для решения уравнений Вольтерра первого рода (18.8) 
удобнее применять квадратурные формулы открытого типа, 


например, формулу средних прямоугольников. Фиксируя в таком 
уравнении переменную / равной значениям 


н=а+й, 12 = +, Ш. ЕВ НИ, (18.40) 


получаем равенства 


1, 
Гоа, 5)х(5 465 > Л), = 2, й , (18.41) 
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из которых видно, что здесь нет необходимости считать узлы 
квадратур 5; совпадающими с узлами (;; для формулы прямо- 
угольников (средней точки) (12.8) берем их посередине элемен- 
тарных промежутков интегрирования [1;_1, ; | (рис 18.3). 


0 а 9 52 53 5 


Рис. 18.3. Расположение узлов квадратурных формул прямоугольников 
при численном решении уравнений Вольтерра 


При этом каркас приближенного решения определяется именно 
узлами 5$,;, т.е. полагаем 


х! = (51), х2 = 2(52), й, хи м хи). (18.42) 


При взятой за основу квадратурной формуле прямоуголь- 
ников с учетом (18.42) равенства (18.41) приводят к следующим: 


РОС, 51) = Ли), 
#О(15, 51 )х + ЙО(ЬЬ, $2 )х2 = 1(15), (18.43) 
пО(аз, 51) + №О(13, 52 )хо + ПОВ, $3 )хз = 1(43), 


и т.д. Напомним, что здесь узлы [,12,й сетки на оси О! опре- 
делены в (18.40), а 


ии -5 У 1=], 9. Й 
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Из равенств (18.43) последовательно находим: 


ва а) 
ВОИ, 51) 
| 
Ла) -#>. О, 5})х) (18.44) 
и (=2,31). 
ПО, 51) 


В случае применения в (18.41) квадратурных формул замк- 
нутого типа при совпадающих системах узлов {5;} и {1;} возни- 
кает проблема вычисления значения х| = х(п) = х(51) = х(а), ко- 
торой не было в аналогичной ситуации с уравнениями второго 
рода. Действительно, это значение не может быть найдено непо- 
средственно из равенства (18.41), при Г =1 теряющего смысл, а 
без него нельзя подсчитывать последующие значения хо, хз, й. 


Чтобы вычислить х|, продифференцируем рассматриваемое 
уравнение (18.8) по Е и в полученном таким образом уравнении 
второго рода 


1 
О(е, х(и) + [ОГ® 5) ($) = ГИ) 
положим #=а. Имеем равенство 
О(а, а)х(а) = }(а), 


что равносильно х(а) = Д’(а)/СКа, а), т.е. можно принять 


Х'(а) 
а, (18.45) 
” Оп 


Далее при использовании, например, квадратурной формулы 
трапеций следует: 


й 
--О>х 
Л 5 бе 


р , ( 1 8.46) 
{@) 


й й 
> бя + Ох» = = х= 
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й й 
7 Вр + ЙОзох> +2 933% =з3 > 


й 
= 2 93 — ЙОз2х› 


хз ‚ (8.47) 
по 
5733 
т.е. в общем случае при любом / = 2, 3, й 
р. д 
= 2 Эля = ПУ Оцхь 
О и и (18.48) 
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(обозначения те же, что ив (18.24)). 


Пример 18.4. Рассмотрим численное решение уравнения 


1 
хбр (18.49) 
1 


на промежутке [1, 1.3] по формулам трапеций и прямоугольников, полагая 


1 
шаг й = 0.1. (Точное решение х(г) = — со значениями 
1 


х(И) =1, х(1.1) = 0.82645, х(1.2) = 0.6944, х(1.3) = 0.59172, 
х(1.05) = 0.90703, х(1.15) = 0.75614, х(1.25)= 0.64). 
Применим сначала формулу трапеций. Зафиксируем значения 


Н =|, 12 =. в =1.2, щ =1.3 


и в получающихся при этом из (18.49) равенствах 


и 
[92 +5? +1) (5) = -, 1=12,3, 4 
1 7 
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узлами $, квадратур считаем те же точки 1, 1.1, 1.2, 1.3. Вычислив по 
формуле (18.45) начальное значение решения 


2 
х()=х Ри й =1 
ГО 2+1 

1=1 


последующие его значения на сетке 5,} находим по формулам (18.46) 
(18.48). Имеем: 


1.12 тт -0050.12 +12 +1).1 


х(1.1) = хо = 7 5 = 0.8211, 
0.05(1.17 +1.17 +1 


1.22 -15-605.2? +12 +1).1-01.(.22 +1.12 +1).0.8211 


^ 


х(1.2) = хз = ® 
ы 0.05.22 21 +1) 


= 0.6957, 


1321 0.050 32 +12 +1).1- 0.10.32 +1412 +1)-0.8211 
х(1.3) = ха = 1.3 - 


й 0.05.32 +1.32 +1) 


2. 2 
_ 0.11.3 в ы 0.6957 0.5877. 
0.05\1.37 +1.37 +1 


Теперь обратимся к формуле прямоугольников. Для данного случая 
в равенства (18.43) или в вытекающие из них формулы (18.44) при задан- 
ном й = 0.1 нужно подставлять следующие значения: 


О, 51) = 0.1, 1.05) = 3.3125, Х(и)= Г.) = 0.30091; 
05, 51) = 0(1.2, 1.05) = 3.5425, 
065, 5) = 01.2, 1.15) =3.7625, 1(@5)= Г(.2) = 0.60667; 
О(з, 51) = 013, 1.05) = 3.7925, 
О, 52) = 0(1.3, 1.15) = 4.0125, 
0((;, 53) = 0.3, 1.25) = 4.2525, Г(3)= Г (1.3) я 0.92077. 


Пользуясь ими, последовательно вычисляем: 


х(1.05) = х! = Е = 0.90841, 


678 


0.60667 —0.1.3.5425 . 0.90841 


сы о ОВО О ЕВЕ на, 

Вик 0.1.3.7625 

025) =, _992077-041.37925-090841-04-4.0125-075712 от, 
01.4.2525 


Сравнение тех и других серий приближенных значений решения с 
точными значениями демонстрирует достаточно высокую эффективность 
применяемых квадратур (как и следовало ожидать, несколько лучшие ре- 
зультаты показывает квадратурная формула средней точки). 


18.4. КВАДРАТУРНО-ИТЕРАЦИОННЫЙ МЕТОД 
ПОСТРОЕНИЯ РЕЗОЛЬВЕНТ 


Предположим, что мы находимся в ситуации, когда требу- 
ется решать серию интегральных уравнений второго рода с од- 
ним и тем же ядром О(, 5) и разными свободными членами 


* 
1) ). Для определенности будем считать, что речь идет об ин- 


тегральном уравнении Фредгольма (18.5).В таком случае, подоб- 
но тому, как это делается для линейных алгебраических сис- 
* 


тем Ах =, где решения х при разных правых частях В 
вычисляются через предварительно найденную обратную к А 


— * = 
матрицу А 1 по формуле х =А Ъ, здесь также имеется воз- 
можность формально подсчитывать соответствующие разным 


Г(Г) решения х° (6) уравнения (18.5) по формуле вида 
х (= д Ве, г; Л) ()ат + ГО. (18.50) 


В этой формуле роль разрешающего оператора (аналога обрат- 
ному) играет функция К(Е, 5; А), называемая резольвентой инте- 
грального уравнения или, быть может, точнее, резольвентой се- 


мейства ядер ЛО(, 5) уравнения (18.5) ®) „При непрерывных 
ядрах О(1, 5) и значениях параметра А, удовлетворяющих, на- 


* 

) Оговоренная ситуация возникает, например, при решении не- 

линейного интегрального уравнения модифицированным методом 
Ньютона [80, 95]. 


*%* 
) Иногда вместо термина резольвента используют термин разре- 
шающее ядро [109]. 
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пример, условию (18.10), несложно установить существование 
единственной непрерывной функции А(ь, 5; 4), к которой абсо- 
® 


лютно и равномерно при /, 5 е [а, 6] сходится ряд Неймана ) 
ее] | 
11,5), (18.51) 
К=1 


определяемый через итерированные ядра О, (1, 5) такие, что 
Ь 
О1(, 5) = О(, 5), ОкС 5) = [ Об, т) Ор ие, $) 4т. (18.52) 
а 


Последовательное вычисление итерированных ядер по ре- 
куррентной формуле (18.52) и подсчет частичных сумм ряда 
(18.51) позволяют, в принципе, получить сколь угодно хорошее 
приближение к резольвенте А(ё, 5; А). Но цена такого приближе- 
ния будет слишком высока (за редкими исключениями, когда та- 
кую процедуру можно провести аналитически, а не численно). 
Более продуктивные способы приближенного нахождения ре- 
зольвенты опираются на простые интегральные соотношения 
между резольвентой и ядром. Практически в любом пособии по 
интегральным уравнениям можно найти вывод таких соотноше- 
ний; их ВИД 


Ь 
К(Е, 5; 4) = О, 5) + и] О(Е, т)К(Ф, 5; Лат (18.53) 


а 


Ь 
Ю(1, 5; 4) = О(Ь $) + и] К(Е, т, Л)О(т, зат. (18.54) 

а 
Тот факт, что резольвента, согласно формулам (18.53), (18.54), 
может рассматриваться как решение интегрального уравнения с 
тем же ядром О(&, 5) (при фиксировании в ней одного из двух ар- 
гументов ), позволяет подходить к ее численному построению с 
тех же позиций, которые были заложены в $ 18.2 при прибли- 

женном решении уравнений Фредгольма второго рода (18.5). 

Остановившись на какой-либо квадратурной формуле ви- 
да (18.21), по ее узлам на отрезке [а, 5] и, соответственно, на 
квадрате [а, Ь]х [а, Ь] строим сетку, узлами которой служат точ- 
ки (.; 5;), лежащие на пересечении линий [=(;, 5=5, 


* ; 

) Нейман Карл Готфрид (1832-1925) — немецкий математик. Его 
основные труды относятся к дифференциальным уравнениям и алгебраи- 
ческим функциям. 
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* 
(11 1=12,й ‚п) в пределах данного квадрата * Применение 
выбранной квадратурной формулы к интегральному соотноше- 
нию (18.54) приводит к равенству 
И 
КСЕ, 5, Я) = ОСЬ, 5) + я >. Ак ВС, Тк, ЯО(тк, 5) + 7(6, 8} 
К=1 
где г(!, 5) — погрешность квадратуры. Отбросив эту погреш- 
ность (малости которой можно добиться разными способами, на- 
пример, увеличением числа узлов и), переходим к приближен- 
ному уравнению относительно точной резольвенты А(ё, 5; 4), 
которое, в свою очередь, заменяем точным уравнением относи- 
тельно приближенной резольвенты (Е, 5; 4) = Ю( 5; 4): 
—> И — 
Е((, 5; 1) = 0, 5) +1». АКВ, ть; ЛО, 5). = (18.55) 
К=1 
Из функционального уравнения (18.55) фиксированием перемен- 


ных [=1,, 5 =5, (В 1л=Ь2,Й ‚п) получаем п? дискретных 
уравнений 


— И — 
Ав, 5 й) = О(Е,, 5;) + АУ ЧИ, Тр; 1) О(тк, 5) (18.56) 
К=1 
относительно сеточных значений приближенной резольвенты, 
те.ее каркаса К; (^) := К (1,,5;;^). 
Введем и х и-матрицы 
я = я я 
В( 7) РЯ (®(е,, 5 1) 1 , о = (О(,, 5) а , 
А := Фаз( Ак) |. 


Учитывая совпадение значений у 5, т; при совпадении индек- 


сов Г, /, К, совокупность уравнений (18.56) теперь можно пере- 
писать в виде одного матричного уравнения 


В( 1) =О+1В(ФАО, (18.57) 


в чем нетрудно убедиться, выполняя непосредственно (в элемен- 
тах) фигурирующие в (18.57) матричные операции. 


* 
) Можно пойти и обратным путем: сначала ввести сетку, например, 
равномерную, а уже к ней подобрать подходящую квадратурную формулу. 
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Формально матричное уравнение (18.57) легко разрешается 
относительно искомого каркаса приближенной резольвенты: 


В( 4) = ОЕ - лАО) (18.58) 


^\-1 
Согласно лемме Неймана, матрица (Е - 140) существует и 
представима матричным рядом 


^ =] ^ р) ^ 2 3 ^ З 
(Е- 140) =Е+ДАО + 12 (АО) + (АО) +й (18.59) 
в том и только в том случае, когда спектральный радиус матрицы 
ДАО меньше единицы. Предположим, что это условие выполне- 
но, т.е. 
р(л^о) < 1. (18.60) 


Тогда искомый каркас приближенной резольвенты, в силу 
(18.58) и (18.59), также можно записать в виде суммы матрично- 
го ряда: 


^ ^ лол ^ ^ \2 ^ ^ \3 

В(1) = О + ДОАО + 2?О(АО) + 3о(А9) +Й . (18.61) 
Вместо получения приближений к В(Я) подсчетом частичных 
сумм ряда (18.61), который может сходиться весьма медленно, 
вернемся к представлению (18.58) и для обращения матри- 
цы Е - ДАО применим быстросходящийся итерационный про- 
цесс Шульца (3.34). 

Чтобы не усложнять записи, примем за основу наиболее 
простой и распространенный процесс уточнения элементов об- 


ратной матрицы В по формулам 
Ор = Ок + Од, 
и к=0,1,2,й . (18:92 
Известно, что необходимым и достаточным условием сходимо- 


—1 
сти последовательности матриц | бу к матрице В является ус- 
ловие 


Ю(фо)<1, (18.63) 
и если начальное приближение Ц, выбрано так, что 
№0 < а <1, 
то справедливы оценки погрешности 
ИЯ о 
|в- -0: < [Од < [Мо] ой (18.64) 
1-м [ 1-9 


682 


характеризующие (18.62) как метод второго порядка (см. $ 3.6). 


При обращении матрицы Е — ДАО в записи итерационного 
процесса (18.62) изменяется лишь вторая строка (для подсчета 


&\ 
невязки), т.е. приближения Ц; к (Е = 1АО) можно находить по 
формулам 


О, 1 = 9х + Ору, Л 
| ы | (18.65) 
ук =Е- (Е - 1400, 
если выполняется условие (18.63). Учитывая, что при усло- 
вии (18.60) матрица (Е _ 440). может быть разложена в ряд по 
формуле (18.59), возьмем в качестве начальной матрицы Од в 
процессе (18.65) первый член этого разложения, т.е. положим 
Оо = 


Тогда начальная невязка, «величина» которой определяет сходи- 
мость метода, будет 


40 =Е- (Е - дАОД = 1АО, 


и, следовательно, в таком случае необходимое и достаточное ус- 
ловие (18.63) сходимости итерационного процесса (18.65) совпа- 
дает с необходимым и достаточным условием (18.60) существо- 
вания искомой обратной матрицы и ее представимости 
матричным рядом (18.59). 


Таким образом, если р(лАО) < 1, то начатый с Чу =Е 


итерационный процесс (18.65) сходится к матрице (Е _ АО) ', 
а значит, и последовательность матриц В} = (610) к, в силу ра- 
венства (18.58), сходится к матрице В( 7) — каркасу прибли- 
женной резольвенты ЕЮ(1,5; Л) при всяком фиксированном 4, 
отвечающем условию р ДАО < 1. Если, более того, 


[#9] <а<1, (18.66) 


то можно воспользоваться вытекающими из (18.64) оценками 
(апостериорной и априорной) 


| оны, 
[6 - в |= [о] < 2 (18.67) 
1-м 1-4 
при любых мультипликативных нормах таких, что ||| =1. 
Подводя итог, скажем, что при определенных условиях, на- 
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пример, за счет измельчения сетки, искомая резольвента 
К(Ь5;71) уравнения Фредгольма второго рода с ядром 
АО(, 5) при фиксированных значениях А может быть сколь 
угодно хорошо представлена функцией (1, 5; 4), те. ихи- 
матрицей В(4); последняя, в свою очередь, может быть сколь 


угодно хорошо приближена матрицами В, = ОО; с помощью 
квадратично сходящегося итерационного процесса (18.65) вы- 
числения матриц 9; (предварительно проверяется условие 
(18.66)). 


Пример 18.5. Рассмотрим поведение описанного процесса по- 
строения приближений к каркасу резольвенты, взяв ядро 
0(,5)=125-152, 051551 (18.68) 


и параметр 1 = 4. 
Воспользуемся квадратурной формулой Гаусса с двумя узлами 


1 
Тех = 0.54(0.211325) + 0.50(0.788675) 
0 


(см. формулу (12.52) при а=0, Б=1, и=2) и в соответствии с ней зада- 
дим на квадрате [0, ]х[0, 1] 2х2-сетку узлов (1;;5,) искомого каркаса 
так, как это показано на рис. 18.4, где для удобства сопоставления сеточ- 
ных значений и элементов матриц ось О! «перевернута». 


0.211325 0.788675 1 


0.211325 


0.788675 


1 


Рис.18.4. Сетка для подсчета каркаса резольвенты на основе 
квадратурной формулы Гаусса с двумя узлами 
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В таком случае имеем 


^ 0 — 0.0962 0.5 0 10 
о |= й А = Р Чо = Е = $ 
0.0962 0 0 0.5 01 


и, следовательно, при данном Я = 4 
аа 0 — 0.1925 
м ^ (0.1925 0 


Убедившись в малости |\у0о|, что означает выполнение требова- 


ния (18.66) и, тем более, (18.63), далее продолжаем счет по форму- 
лам (18.65): 


1 0.1925 - 0.0370 0 
о, м ь 1 В ; 
0.1925 1 0 0.0370 
о. _ (09630 —0.1853 _ (0.0014 — 0.0000 
2=| 0.1853 0.9630) “2? [0.0000 0.0014 
_ (0.9643 т. _ (0.0000 — 0.0000). 
31| 0.1856 0.9643) “3 | 0.0000 0.0000] 


Ясно, что с используемым числом десятичных знаков дальнейшего 
уточнения значений элементов матриц Ш),  приближающих 


› 


^\-1 

матрицу (Е АО) ‚ происходить не будет. Значит, искомый каркас ре- 
зольвенты ядра (18.68) с д = 4 на заданной сетке может быть приближен- 
но представлен матрицей 


0 —0.0962\/ 0.9643 —0.1856 
0.0962 0 0.1856 0.9643 


. - 0.0179 — 0.0928 
В; =00; = 


0.0928 — 0.0179 


Насколько полученная матрица В; близка к истинному каркасу ре- 
зольвенты на данной сетке, можно выяснить, зная для этого ядра точную 
резольвенту [41]: 


Ка, $ 4)= 3505 —1065—6). 


Подсчитав ее каркас (с четырьмя знаками после запятой) 
Е - [. 0.0183 — в 
0.0867 — 0.0303 
находим ошибку приближения Вз: 
с (- 0.0004 — | 
— 0.0059 -— 0.0124 


Г 


Последняя матрица свидетельствует о том, что каркас резольвенты 
найден, грубо говоря, с точностью до сотых, и эта точность практически 
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достигается уже на первой итерации, т.е. можно принять 
— ^ — 0.0185 0.0962 

В А В, = ОО! = 

0.0962 — 0.0185 


с матрицей ошибок 
г _[ 0.0002 0.0025 
1 (- 0.0095 — 0.0118)" 


Разобранный пример с известной резольвентой показывает, 
что при построении каркаса резольвенты  квадратурно- 
итерационным методом точность итерационного обращения мат- 
рицы Е-АЛАО предопределяется точностью сведения инте- 
гральной задачи к матричной и легко регулируется указанием 
малости величин [ух | или |0; —О;_1|. Из-за проблем с реаль- 
ным получением гарантированных оценок погрешностей дискре- 
тизации, здесь представляется целесообразным для контроля 
этих погрешностей квадратур использовать механизм сгущаю- 
щихся равномерных сеток, общими узлами которых должны 
служить узлы заданной сетки искомого каркаса. 


УПРАЖНЕНИЯ 


18.1. По формулам (18.14)—(18.16) решите уравнение с вырожден- 
ным ядром (18.19). Сравните полученное таким способом приближенное 
решение уравнения (18.18) с его точным решением х(1)=1. 


18.2. Запишите систему из и уравнений, к которой сводится приме- 
нение метода конечных сумм на основе квадратурной формулы прямо- 
угольников: 


а) для уравнения Гаммеритейна 
Ь 
х(#) = [О(, 5)(5, х(5)) 6, ге [а, 6]; 
а 
6) для уравнения Урысона 


= ке 5, ^(5))б, 1е[а,Ё]. 


18.3. Составьте систему уравнений, к которой сводится применение 
метода конечных сумм на основе квадратурной формулы трапеций с пя- 
тью равностоящими узлами для решения нелинейного уравнения 
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Вольтерра 


х(0) = ЕС, 5, (5), 1Е[а,6. 


18.4. Дано уравнение 


21 217 
«= ое, +=: (18.69) 


Найдите его приближенное решение квадратурным методом с тремя узла- 
ми, пользуясь: 

а) формулой трапеций; 

6) формулой Гаусса. 
В точках #=1, 1[=1.5 и 1 =2 сравните полученные результаты с точны- 
ми значениями решения х(/), найдя его методом вырожденных ядер. 


18.5. Дано уравнение Фредгольма первого рода 
1 
1 1 
[2 вв = +—, 1%[0,1. 
0 2 8 
1. Составьте для него уравнение Тихонова, полагая О(Е, 5) = Ты я 
= 1 1 
= +. 
2 8 
2. Используя уравнение Тихонова, получите СЛАУ относительно 
значений каркаса @-регуляризированного решения на сетке 0, 0.5, 1, 
беря шаги дискретизации по всем независимым переменным одинаковыми 
(= 0.5) и применяя квадратурную формулу трапеций: 
а) в случае регуляризации нулевого порядка; 
6) в случае регуляризации первого порядка (производные здесь ап- 
проксимируйте разностными отношениями). 


18.6. На уравнениях Вольтерра второго рода (18.39) и первого рода 
(18.49) примеров 18.3 и 18.4 соответственно, используя те же сетки, ис- 
следуйте применение в методе конечных сумм квадратурных формул ле- 
вых и правых прямоугольников (12.6), (12.7). Сравните результаты между 
собой и с теми, которые были получены в указанных примерах с помощью 
других формул численного интегрирования. 


18.7. Квадратурно-итерационным методом найдите приближенный 
каркас резольвенты для ядра уравнения (18.69) (считая Я =1) на равно- 
мерной Зх З-сетке узлов квадрата [1, 2]х [1,2], применяя: 

а) квадратурную формулу трапеций; 

6) квадратурную формулу Симпсона. 

Предварительно оцените, сколько нужно сделать шагов процесса (18.65), 


чтобы вносимые неточным обращением матриц искажения каркаса ре- 
зольвенты не превышали 0.001 в случае а и 0.0001 в случае 6. 
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ГЛАВА 19 |ДИФФЕРЕНЦИАЛЬНЫЕ 
УРАВНЕНИЯ С ЧАСТНЫМИ 
ПРОИЗВОДНЫМИ 


Записываются и классифицируются основные уравнения ма- 
тематической физики и постановки задач для них. Напоминается 
один их немногих аналитических способов решения УМФ — метод 
Фурье, примененный здесь к задаче Дирихле для уравнения Лапласа 
в прямоугольнике. Описываются два подхода к построению полу- 
дискретного метода прямых (проекционный и конечноразност- 
ный); объектом для его демоистрации выбрана начально- 
граничная задача для уравнения теплопроводности. Далее рас- 
сматривается вариационная формулировка для операторного 
‘уравнения в гильбертовом пространстве, приводящая к энергети- 
ческому методу, и метод Ритца в развитие последнего. Показы- 
вается, к чему сводится реализация метода Ритца в случае реше- 
ния им задачи Дирихле для уравнения Пуассона. Перечисляются 
наиболее важные моменты, отражающие суть метода конечных 
элементов, базирующегося на методе Ритца при фиксировании в 
нем в качестве координатных функций двумерных В-сплайнов. 


19.1. ПРИМЕРЫ УРАВНЕНИЙ МАТЕМАТИЧЕСКОЙ 
ФИЗИКИ. КЛАССИФИКАЦИЯ УРАВНЕНИИ С 
ЧАСТНЫМИ ПРОИЗВОДНЫМИ 


При изучении большинства физических и иных процессов и 
явлений приходится сталкиваться с тем, что исследуемые свой- 
ства объекта описываются функциями не одной, а нескольких 
переменных величин. В таких случаях при составлении матема- 
тических моделей изучаемых явлений вместо обыкновенных 
дифференциальных уравнений возникают уравнения с частными 
производными. Аргументам неизвестных функций таких уравне- 
ний зачастую придается смысл пространственных переменных и 
времени; тогда дифференциальные уравнения с частными произ- 
водными по этим переменным, описывающие реальные физиче- 
ские модели (или идеальные физические явления), называются 
уравнениями математической физики, а изучающая их наука 
— математической физикой [199]. 

Приведем несколько классических примеров уравнений ма- 
тематической физики. Искомой функцией в них выступает функ- 
ция и, в разных задачах интерпретируемая по-разному, а аргу- 
менты х, у, 2 и Г имеют смысл пространственных переменных 
и времени соответственно. Во многих уравнениях фигурирует 
сумма частных производных второго порядка, называемая 
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оператором Лапласа: 


2 2 
ии, если и=и(х, у), 
ВИ 9х ду 
Ди := Фуотади = 5 2 2 (19.1) 
д ис. С о если и=и(х, у, 2) 
9х 0“ 02 
1. Уравнение Лапласа (уравнение потенциала) 
2 2 
9и би. (19.2) 


дх? ду? 
Это уравнение используется для математического описания 
плоских электростатических полей, магнитных полей посто- 
янных токов, стационарных тепловых полей; применяют его и в 
задачах гидро- и аэродинамики. Аналогичные пространст- 
венные поля описываются трехмерным уравнением Лапласа 


2 2 2 
би би би. (19.3) 
0х дуг 02 
Более коротко и единообразно двумерные и трехмерные уравне- 
ния Лапласа можно записать через оператор Лапласа (19.1): 
Ди = 0. (19.4) 


Функции, удовлетворяющие уравнению Лапласа, называют гар- 
моническими функциями [5, 53]. 


2. Уравнение Пуассона имеет вид 
Аи= р, (19.5) 


где и и Г одновременно являются (считаются) функциями либо 
двух, либо трех пространственных переменных. Область приме- 
нения этого уравнения — задачи электростатики, электронной 
оптики, теории упругости и некоторые другие. 


3. Уравнение теплопроводности (Фурье) 


2 
ди — 12 0и, (19.6) 
[61 ах? 
где а — некоторая постоянная (в каждом конкретном случае 


своя) описывает диффузионные процессы, в частности, распро- 
странение тепла в тонком стержне. Очевидно, (19.6) — это од- 
номерное уравнение теплопроводности. Для описания процесса 
распространения тепла в плоской пластинке или объемном теле 


689 


уравнение теплопроводности записывается через двумерный 
или, соответственно, трехмерный оператор Лапласа Ди: 


2 = а? Аи. (19.7) 

Уравнение теплопроводности (19.6), а также уравнение 

(19.7), являются однородными уравнениями. При наличии внут- 

ри стержня тепловых источников или поглотителей тепла обоб- 

щающее (19.6) уравнение теплопроводности будет неодно- 
родным: 


ди 12 д?и 


5 Ри 0. 


4. Волновое уравнение (уравнение колебаний струны) — 


это уравнение вида 


2 2 
ди — 12 ди. (19.8) 


описывающее свободные колебания, или 


д?и _ 2 д?и 
эн —+Ль о, 
01 9х 

если колебания совершаются под действием внешней силы, ха- 
рактеризуемой функцией Х(х, [). Двумерное волновое уравнение 


(уравнение свободных колебаний однородной мембраны) вы- 
глядит так: 


2 2 2 
9 29 и би |, (19.9) 


что через двумерный оператор Лапласа можно записать короче в 
виде 


2 
— =а? Аи. 
01 
5. Уравнение Гельмгольиа 
Аи+си=0, (19.10) 


где с = сопз!, является математической моделью установивших- 
ся колебательных процессов. Имеется и неоднородное уравнение 
Гельмгольца — уравнение вида (19.10), дополненное правой ча- 
стью. 
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6. Телеграфное уравнение 


5 у 
ди КС+1С ди, КС _ 1 ди _ | (19.11) 


р’ 0 @ т 265 


описывает изменение потенциала и в линии электропередачи, 
где х — расстояние, { — время, Г, — коэффициент самоиндук- 
ции, С, К, С — соответственно емкость, сопротивление и ха- 
рактеристика потерь на единицу длины линии. При А =0, С =0 
телеграфное уравнение (19.11) превращается в волновое уравне- 
ние (19.8). 


7. Уравнения акустики — это система уравнений 


ди 1 ЭР _( 
ОЕ Ро Ох 


др 20 
Я а 
[61 ох 
описывающая распространение плоских звуковых волн в покоя- 
щейся среде. Здесь: и — скорость возмущенной среды, р — 
давление в ней, 20 — ПЛОТНОСТЬ, @0: == постоянная, характери- 


зующая сжимаемость среды. 


8. Уравнение переноса 
ди, „ди 
= +е-= = АО 19.12 
служит простейшей одномерной моделью распространения час- 
тиц в веществе (где постоянную с можно интерпретировать как 
скорость переноса). 


Приведенные здесь уравнения, разумеется, не исчерпывают 
все многообразие о математической физики. Более под- 
робные сведения об этих и других содержательных уравнениях в 
частных производных можно почерпнуть в специально посвя- 
щенной им литературе и в некоторых пособиях по численным 
методам (см. [5, 9, 20, 21, 53, 78, 81, 103, 143, 144, 156, 160, 191] 
и др.). Главное, что приведенные выше уравнения являются наи- 
более простыми и, вместе с тем, характерными представителями 
множества уравнений математической физики. Это позволяет 
считать такие уравнения удобным и адекватным полигоном для 
изучения свойств уравнений в частных производных, коррект- 
ных постановок задач с ними и построения методов их решения. 

Анализируя форму вышеприведенных типичных уравне- 
ний, видим, что все они содержат частные производные искомой 
функции и не выше второго порядка, причем линейным образом 
(при этом, уравнения акустики, представляющие собой систему 
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линейных дифференциальных уравнений первого порядка, могут 
быть записаны с помощью одного линейного уравнения второго 
порядка). Следовательно, все те уравнения из перечисленных, в 
которых функция и зависит только от двух переменных, а имен- 
но, в случаях, когда и = и(х, у) (см. 1, 2, 5), или и = и(х, 0) (см. 3, 
4, 6-8), можно считать частными случаями уравнения 


92и 9?и 9?и ди ди 
А+ = . 
РЕ 5+2 5х я Ра ыы +Си= (19.13) 


Запись (19.13) отражает а вид линейного дифференциаль- 
ного уравнения с частными производными второго порядка 
относительно неизвестной функции и(х, у). В наиболее общем 
случае его коэффициенты А, В, С, РО, Е,С и правая часть К 
есть некоторые функции независимых переменных х и у. Если 
Е =0, то уравнение (19.13) называется однородным; в против- 
ном случае — неоднородным. 

Классификацию конкретных уравнений в частных производ- 
ных, принадлежащих семейству уравнений (19.13), производят по 
аналогии с классификацией кривых второго порядка в зависимости 


от знака дискриминанта В" АС (который, как доказано, не из- 
меняется при различных естественных преобразованиях, т.е. знак 
дискриминанта является инвариантом таких преобразований). А 


именно, если В? -АС<0 ‚ то ранение (19.13) есть уравнение эл- 
липтического тина, воли В -АС>0 — уравнение гиперболи- 


ческого типа, если В? -АС=0 — ‘уравнение параболического 
типа. При непостоянных коэффициентах А, В, С может оказать- 


ся, что дискриминант В? — АС не имеет постоянного знака; в та- 
ком случае уравнение (19.13) относят к уравнениям смешанного 
типа. 

В случае постоянных коэффициентов при вторых производ- 
ных в уравнении (19.13) с помощью простого преобразования 
переменных его приводят к виду, не содержащему смешанной 
производной, т.е. к той же форме (19.13), нос В =0, и тогда оп- 
ределение типа уравнения весьма просто. Именно: если в уравне- 
нии (19.13) В =0 и постоянные коэффициенты при вторых про- 
изводных имеют одинаковые знаки в одной части уравнения, то 
это уравнение — эллиитическое, если разные — гипербо- 
лическое; если вторая производная по ‚бо из переменных от- 


сутствует (т.е. В=0, АС =0 при а = 0) — параболиче- 
ское. Пользуясь этим правилом, легко классифицируем 
содержащиеся в этом параграфе конкретные уравнения матема- 
тической физики, имеющие вторые частные производные отно- 
сительно функции двух переменных: эллиптическими являются 
уравнения Лапласа, Пуассона, Гельмгольца; параболическим — 
уравнение теплопроводности; гиперболическими — волновое и 
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телеграфное уравнения (к последнему типу также сводится сис- 
тема уравнений акустики). Уравнение переноса, хотя формально 
можно считать частным случаем уравнения (19.13), не содержит 
вторых частных производных и по дискриминанту не классифи- 
цируется. 

Не составит труда записать общий вид линейного диффе- 
ренциального уравнения второго порядка с частными производ- 
ными искомой функции от трех и большего числа независимых 
переменных. Отнесение конкретных многомерных уравнений с 
частными производными к эллиптическому, параболическому 
или гиперболическому типу производят в зависимости от знака 
соответствующей квадратичной формы. 

Для уравнений математической физики естественен и дру- 
гой принцип классификации. В них, как уже отмечалось, аргу- 
мент / трактуется как время, а остальные независимые перемен- 
ные играют роль пространственных координат. Поэтому в 
случае, когда уравнение с частными производными не содержит 
переменной [, оно называется стационарным, при наличии в 
уравнении переменной { оно описывает процессы, развиваю- 
щиеся во времени, и называется нестационарным или эволюци- 
онным уравнением (иногда понятие эволюционного уравнения 
трактуется несколько уже [117]). 


19.2. ПОСТАНОВКИ ЗАДАЧ ДЛЯ УРАВНЕНИЙ 
МАТЕМАТИЧЕСКОЙ ФИЗИКИ 


Каждое уравнение с частными производными, как и обык- 
новенное дифференциальное уравнение, имеет бесчисленное 
множество решений. При этом, если, например, линейное одно- 
родное обыкновенное дифференциальное уравнение второго по- 
рядка обладает базисом из двух линейно независимых функций- 
решений, через которые можно выразить любое его решение, 
введя произвольные постоянные, то для линейных однородных 
уравнений в частных производных второго порядка, каковыми 
являются уравнения (19.2), (19.3), (19.6), (19.11), такого конечно- 
го базиса не существует. Поэтому не только получение, но и 
формальная запись общего решения даже для простейших урав- 
нений в частных производных зачастую вызывает большие за- 
труднения. Однако постановщикам реальных задач, как правило, 
общее решение и не нужно. Интерес для них представляют те 
решения, которые обусловлены соответствующими уравнению 
данными, описывающими явление в целом. Ставя формальную 
задачу для конкретного уравнения в частных производных, сле- 
дует позаботиться о том, чтобы добавляемые к уравнению из тех 
или иных соображений условия выделяли из общего решения 
единственное частное решение, чтобы это частное решение на 
самом деле существовало в заданном функциональном простран- 
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стве и чтобы оно мало изменялось при малых изменениях усло- 
вий. Эти три требования — разрешимости, однозначности и 
непрерывной зависимости от исходных данных (иначе, устойчи- 
вости) — в совокупности характеризуют корректность поста- 
новок задач математической физики (см. $ 1.7). 

Рассмотрим несколько примеров постановок задач для про- 
стейших из приведенных в предыдущем параграфе уравнений 
математической физики. Но прежде заметим, что для уравнений 
с частными производными так же, как и для обыкновенных диф- 
ференциальных уравнений, ставятся начальные и краевые зада- 
чи, хотя разделение это весьма условно. Если одна из независи- 
мых переменных играет роль времени, то условия, относящиеся к 
начальному моменту времени (1 =), называются начальными 
условиями, и соответствующая задача носит название начальной 


задачи (или задачи Коши”). Условия, которые задаются при 
различных значениях пространственных переменных (обычно на 
границе области изменения этих переменных), называются гра- 
ничными (или краевыми) условиями. Как правило, для уравне- 
ний эллиптического типа, описывающих стационарные процес- 
сы, задаются граничные условия, т.е. ставятся граничные 
задачи, а для уравнений параболического и гиперболического 
типов, моделирующих эволюционные процессы и явления, для 
определенности нужно одновременно задавать условия, началь- 
ные по времени и граничные по пространственным переменным, 
что приводит к смешанным задачам. 

Пусть линейное дифференциальное уравнение с частными 
производными второго прядка (19.13) является уравнением эл- 


липтического типа (т.е. 8-Я 0), и пусть @с В, — задан- 
ная двумерная область с границей Г, в замыкании которой опре- 
делено уравнение и в которой ищется решение и = и(х, у). Если 
наряду с уравнением (19.13) эллиптического типа выставляется 
условие 


Ц (х у)ег = Ф(х У), (19.14) 


где ф(х, у) — заданная во всех точках (х; у) границы Г непре- 
рывная функция, то совокупность уравнения (19.13) и гранично- 
го условия (19.14) определяет первую краевую задачу. Примени- 
тельно к уравнениям Лапласа (19.2) и Пуассона (19.5) ее 


*) Здесь имеются определенные терминологические тонкости. Как 
отмечается в [53, с.91], часто в литературе начальной задаче для уравне- 
ния теплопроводности приписывается название задачи Коши, хотя тако- 
вой она не является. 
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называют задачей Дирихле. Если эллиптическое уравнение 
(19.13) рассматривается совместно с условием 


би =Ф(х у), (19.15) 
ы (х; У)ЕГ 
где 5 — производная искомой функции и(х, у) по направле- 


нию п внешней нормали, определяемой соответствующей точ- 
кой (х;у) границы Г заданной области ©, то в таком случае 
имеем вторую краевую задачу. В частности, для уравнений Лап- 
ласа и Пуассона вторую краевую задачу, т.е. сочетания (19.2) с 
(19.15) и (19.5) с (19.15), называют задачей Неймана. Рассмат- 
ривается и третья краевая задача для эллиптических уравне- 
ний, обобщающая первые две. Она определяется заданием до- 


полнительного к уравнению (19.13) (при В? -АС< 0) условия 


аи +0 а. = ф(х, у), 
(х; У)ЕГ 
где |240 |+|@1| = 0. 

Примером постановки начально-граничной задачи для ги- 
перболического уравнения может служить математическое опи- 
сание процесса свободных колебаний однородной струны, за- 
крепленной в точках х=0 и х=/, которой в момент времени 
1 =0 сообщили начальное смещение ф(х) и скорость у(х). Про- 


цесс таких колебаний определяется уравнением (19.8) (где по- 


стоянная а? связана с весом и натяжением струны), сопровож- 


даемым начальными 


и(х, 0) = ф(х), 

Вы о | хе [0, 1] (19.16) 
И граничными 

п | ге [0, +) (19.17) 

ч.0 =0 


условиями. При определенных требованиях к функциям Ф(х) и 
у/(х) решение и(х,Г) этой задачи позволяет в любой момент 
времени / > 0 для любой точки хе (0, [) струны однозначно ука- 
зать величину и отклонения от положения равновесия (и = 0). 


695 


Наконец, наиболее типичной задачей для уравнения парабо- 
лического типа является следующая начально-граничная задача: 


ди _ 20?и 

ев, (19.18) 
и(х,0)=Ф() при хе[о,П, (19.19) 
(0, =@®, ий, б=В@ при!>0. (19.20) 


Физически она может интерпретироваться как задача определе- 
ния температуры и(х,г) в любой точке х тонкого однородного 
стержня длиной / в произвольный момент времени /, если из- 
вестно распределение температуры в стержне в начальный мо- 
мент времени Е =0 (см. начальное условие (19.19)) и известна 
температура на концах стержня х=0 и х=/ в любой момент 


времени {Г (см. граничные условия (19.20)). Коэффициент а? в 
уравнении (19.18) связан с теплофизическими характеристиками 
материала стержня (зачастую уравнение вида (19.18) рассматри- 


вается без коэффициента а’, что мотивируется превращением 
этого коэффициента в единицу при преобразовании уравнения к 


новой переменной ® =а"1). 

Приведенные здесь задачи отражают основные черты мно- 
жества постановок задач математической физики и далее будут 
служить объектами изучения с позиций численного анализа. 


19.3. МЕТОД РАЗДЕЛЕНИЯ ПЕРЕМЕННЫХ 


Одним из наиболее распространенных способов анали- 
тического решения уравнений в частных производных явля- 
ется метод разделения переменных, называемый также мето- 
дом Фурье. Этот метод впервые был предложен Ж.Даламбером в 
середине ХУШ века для решения волнового уравнения (19.8) с 
начальными и краевыми условиями (19.16), (19.17), а в начале 
ХХ века был развит Ж.Фурье и обоснован М.В.Остроградским и 
П.Дирихле [53, 199]. В любом учебном пособии, посвященном 
теории уравнений математической физики, можно найти описа- 
ние метода Фурье разной степени полноты и строгости изложе- 
ния (см., например, [5, 53]). Здесь мы покажем лишь идею этого 
метода, причем не на волновом уравнении, где он, возможно, 
смотрится более выигрышно, поскольку стали уже привычными 
ассоциации между колебательными процессами и тригонометри- 
ческими рядами Фурье, а на задаче Дирихле для уравнения Лап- 
ласа в прямоугольной области [81]. 
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Пусть на плоскости Оху задан прямоугольник 
О = [0, а]х|-Ь,Ь] (рис. 19.1). Граница Г этой области © обра- 
зована четырьмя отрезками прямых 
х=0, х=а, у=-Б и у=Ь, 
на которых определены непрерывные функции 


и=у (у), и=у>(у), и=о(х), и=Ф>(х) 
соответственно. 


Рис. 19.1. Область определения задачи Дирихле (19.21)—(19.22) 


Ставим задачу: найти функцию и = и(х, у) такую, чтобы 
она удовлетворяла уравнению Лапласа 


2 2 
Е, при (х, ЕО (19.21) 
0х ду 
и чтобы 
им(›) при х=0, 
_ +20) при ха, (19.22) 
Ф1(х) при у=-, 


$2(х) при у=Ь, 
где функции \;, Ф ; предполагаются согласованными в общих 
вершинах прямоугольника. 

Учитывая линейность оператора Лапласа Ли, будем искать 
решение данной задачи в виде суммы двух функций: и] и и. 
Тогда, если каждая из них будет удовлетворять в © уравнению 
Лапласа (19.21) и, кроме того, по отдельности подчиняться усло- 
ВИЯМ 

Ф(х) при у=-Ь, 
и] =3$2(х) при у=Ь, (19.23) 


0 при х=0 и ха=а, 
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(У) при х=0, 
из = 4/2(5) при х=а, (19.24) 
0 при у=-Ь, 
то функция и = и! +и› будет решением поставленной задачи Ди- 
рихле (19.21)—(19.22). 
Будем искать первую функцию-слагаемое решения и. 
Предположим, что она может быть представлена в виде произве- 


дения двух функций, одна из которых зависит только от пере- 
менной х, а вторая — только от переменной у, т.е. 


ил (х, у) = Х(х).У(у). 
Продифференцировав и| дважды по х и по у, имеем: 


(и), =Х’У, (м) „=Х”У, (и), =ХУ, (м)„„=ХУ". 


Следовательно, при таком представлении и! уравнение Лапласа 
(19.21) приобретает вид 


УХ У". 


Для ненулевых Х и У (а именно они нас интересуют) последнее 
уравнение можно записать в форме равенства двух отношений: 


Е" 316 
Хх У 
Левое отношение здесь может зависеть только от х, правое — 
только от у. Значит, в силу их равенства, они не зависят ни от х, 
ни от у, т.е. постоянны. 
Положим 


где Я (+20) — некоторый параметр, и вместо одного уравнения, 
связывающего функции Х и У переменных х и у, будем рас- 
сматривать два уравнения: 


Х"+РХ=0 при хЕ[0, 4] (19.25) 


У"-У=0 при уЕ[-Ь,В] (19.26) 


с одним и тем же параметром 4. 
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Можно считать, что фигурирующее в (19.23) условие и| =0 
при х=0 и при х=а выполняется за счет функции Х(х), т.е. 
уравнение (19.25) сопровождаем краевыми условиями 
Х(0)= Х(а)=0. (19.27) 
Составив для (19.25) характеристическое уравнение 2+2 =0 
и найдя его корни 7 › = Я 7, записываем общее решение ОДУ 
(19.25): 


Х(х) = с1с0$ Ах + с зщ Йх. (19.28) 
Подстановка в него первого из краевых условий (19.27) дает 
0 =с1 со$0+с2зт0 => с =0. 
С учетом этого второе условие (19.27) принимает вид 
0 =со зшйа. (19.29) 


Так как ищется нетривиальное решение краевой задачи (19.25), 

(19.27), то в равенстве (19.29) нельзя полагать со = 0. Следова- 

тельно, параметр А может принимать не любые значения, а лишь 

такие, при которых зт Да =0, т.е. Да=ил (пЕЙ)). Зафикси- 
пл 

ровав в (19.28) Д:=—, с :=0, с›:=с, приходим к тому, что 


решение краевой задачи (19.25), (19.27) имеет вид 
ХО) = сэт Ах, (19.30) 
а 


где значения и достаточно считать любыми натуральными, по- 
скольку добавление к ним целых неположительных и новых ре- 
шений не даст. 

Теперь рассматриваем уравнение (19.26) относительно вто- 
рого сомножителя выражения и — функции У =У(у). Здесь 


корни характеристического уравнения и“ — 1^ =0 действитель- 
ны: 71,2 = Я, и, значит, общее решение суть 


7) =<е” +сое ®. 


В силу соотношений 


1 = 1 _% 
сы = (6 +е №) и в =— (г №) 
2 и 
между показательными и гиперболическими функциями, можно 
перейти к другим произвольным постоянным А и В так, что это 
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общее решение уравнения (19.26) будет представлено в виде ли- 
нейной комбинации гиперболических функций: 


У(›) = Асьйу+ ВЗВ Ху. 


Как уже отмечалось, ДА — параметр, общий для уравнений 
(19.25) и (19.26). Поэтому здесь он тоже ограничен значениями 


пл 
вида Я = —. С учетом этого имеем 
а 


пл пл . ИЛ 
и! = Х(х).У(») = [слеьия > — овзь "А у ших. 
а а а 
Согласно построению, такие функции и|(х, у) удовлетво- 
ряют уравнению Лапласа (19.21) при каждом натуральном пи, и, 
ввиду его линейности, ему будут удовлетворять и функции вида 


п. Кл Кл . КЛ 
5[^ св-— у+ В; $ у | зш-—х, 
= а а а 

а предельным переходом (и —> ©) доказывается, что за и| можно 
принять функцию 


[е. 9) 
и (х, у) = 5[^ ТЯ, зы их. (19.31) 
ри а а а 


Функция (19.31) удовлетворяет всем выставленным для и| 
требованиям, кроме первых двух краевых условий из (19.23). 
Чтобы и они были выполнены, нужно соответствующим образом 
распорядиться двумя семействами параметров А» и В,. А имен- 
но, замечая, что при фиксированных значениях переменной у 
выражение (19.31) представляет собой ряд Фурье, функции $1 (х) 


. пл 
и 9>(х) также разлагаются в ряд Фурье по функциям зт—х в 


а 
промежутке (0, а), и из следующих (записанных лишь символи- 
чески) равенств 


и (х,-5) (ряд Фурье) = 491(х) (ряд Фурье), 
и1(х,Ь) (ряд Фурье) = 492(х) (ряд Фурье) 
однозначно находятся коэффициенты А„, В„, подстановка кото- 
Е о (19.31) приводит к единственной искомой функции 

их, У). 

Функция и›(х, у) в аддитивном представлении искомого 
решения и(х, у) данной задачи Дирихле (19.21)—(19.22) может 
быть получена точно по той же технологии, что и и1(х, у), 
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рассмотрением уравнения Лапласа совместно с граничными 
условиями (19.24). Но можно поступить и иначе, сделав подхо- 
дящую замену переменных и частично воспользовавшись уже 
проделанными при построении и! преобразованиями (см. [81]). 

Подводя итог этого параграфа, следует сказать, что до по- 
явления вычислительной техники было мало альтернатив схема- 
тично описанному здесь методу Фурье. Достоинство этого мето- 
да — в возможности разделять переменные и сводить граничные 
и начально-граничные задачи для уравнений с частными произ- 
водными к аналогичным задачам для обыкновенных дифферен- 
циальных уравнений и представлять решения в аналитическом 
виде. Недостаток — в сложности и, главное, в ограниченности 
множества задач, для которых удается эффективно выполнить 
разделение переменных. В основном, такой метод применяется 
для простых уравнений, заданных на простых областях. 


19.4. МЕТОД ПРЯМЫХ 


В основу метода прямых могут быть положены две концеп- 
ции. Одна из них рассматривает этот метод как развитие метода 
конечных разностей [20, 23, 62, 100, 103]. Другая концепция [23, 
138] опирается на идеи проектирования бесконечномерных про- 
странств решений задач для уравнений с частными производны- 
ми на пространства с конечным функциональным базисом. Оста- 
новимся сначала на последнем подходе, применяя его к одной 
частной задаче, но прежде отметим, что суть метода прямых, 
обусловившая его название, состоит в том, что, например, в 
случае уравнения с частными производными относительно 
функции двух переменных одной из этих переменных придаются 
постоянные значения (иначе, фиксируются некоторые прямые в 
заданной области изменения переменных) и решаются получаю- 
щиеся при этом соответствующие задачи уже для обыкновен- 
ных дифференциальных уравнений. Таким образом, при решении 
граничных и начально-граничных задач для УМФ могут быть ак- 
тивно использованы имеющиеся наработки по методам решения 
начальных и краевых задач для ОДУ. Подобные методы приме- 
няют не только при двух, но и при большем числе неизвестных; в 
таких случаях их называют методами плоскостей или гипер- 
плоскостей [100]. 

Рассмотрим начально-граничную задачу для уравнения теп- 
лопроводности (19.18)—(19.20) в немного упрощенной постанов- 
ке, именно, в случае, когда ©(1) = В(1) = 0, т.е. вместо краевых 


условий общего вида (19.20) возьмем 
и(0,0)=0, и([0=0 при 120. (19.32) 
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Предположим, что известен набор из и базисных функций 
Ф1(х),й , Ф„(х), которые обладают нужной гладкостью, линейно 
независимы на отрезке [0, /] и на концах его обращаются в нуль 
(примеры таких функций приведены в $ 17.4). Будем искать при- 


ближенное решение данной задачи (19.18), (19.19), (19.32) в виде 
линейной комбинации 


[Ш 
ии (0) = Хе (фи) (19.33) 

= 
выбранных базисных функций с некоторыми пока неопределен- 
ными функциональными коэффициентами с;(!) (опять, как и в 
предыдущем параграфе, делается своеобразное разделение пере- 
менных в решении, только теперь уже в заведомо приближен- 
ном). При этом очевидно, что такая функция и, (х, г) удовлетво- 

ряет краевым условиям (19.32). 
Имеется несколько способов определения коэффициентов 
с;(1) в представлении (19.33) приближенного решения. Один из 


них основан на методе коллокации, изучавшемся в $ 17.4 при- 
менительно к краевым задачам для ОДУ. Как и там, на отрезке 


[0, | введем сетку $“ 7 У узлов коллокации х ;, таких, что 


Оз <й <, <, 


и потребуем, чтобы во всех этих узлах функция и„(х, Г) обраща- 


ла уравнение теплопроводности (19.18) в точное равенство, т.е. 
чтобы 


2 
ди д^и 
п = а? п 


01 2 
И дх х=х, 


УтЕЙ,й ‚т. (19.34) 


Дифференцируя функцию (19.33) по {Е и дважды по х, получаем 


д?и 


дит С , И Г п" 
= Усе <>), = Ус (/екх). 
01 1: дх? 2 


Следовательно, условия коллокации (19.34) представляют собой 
систему и уравнений 


УФК = Ха? Фе, 
р | 
И ( 1 9.3 5) 


УФ, ско = Ха’ Фихи)е КО. 
1 1 
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Введем и-мерные векторные функции 


(0 ст (1) 
с(Е):=| + |, (= + 
си (И) 2» (1) 
и постоянные их и-матрицы 
д @ 9) а’) 6 а’) 
А = 6 ( ( ‚ вВ= 6 ( ( 
Ф(х,) @ Фи(х) а’) 6 а’ ф"(хи) 
Тогда система (19.35) коротко записывается в виде 
Ас’(0) = Ве(р). (19.36) 


В силу линейной независимости базисных функций ф;(х) и не- 
совпадения узлов коллокации х,; (строго внутренних на [0, /]), 


можно рассчитывать на обратимость матрицы А и, следователь- 
но, на представление уравнения (19.36) нормальной системой 


с) =А Ве(1) (19.37) 
относительно набора с(Г) неизвестных коэффициентов с;(!) ли- 
нейной комбинации (19.33). 

Для того, чтобы функции с;(г) из системы (19.37) могли 
быть определены однозначно, воспользуемся начальным услови- 
ем (19.19). Поскольку оно должно выполняться в любых точках 
х отрезка [0, /|, это должно иметь место и в узлах коллокации. 
Следовательно, и,(х у» 0) = Ф(х ;), где 0(х) — заданная началь- 
ная функция, т.е. 


Ус (0)е(х,)=9Ф(;), ЛЕЬЙ ‚п. (19.38) 
11 


Введя и-мерный вектор Ф:= (Ф(х1),Й ‚ (хи т и учитывая уже 
введенные ранее обозначения с и А, систему начальных усло- 
вий (19.38) записываем в виде одного векторно-матричного ра- 
венства 

Ас(0)=ф, иначе, с(0)=А\. (19.39) 


Итак, нахождение приближенного решения данной началь- 
но-граничной задачи (19.18), (19.19), (19.32) с частными произ- 
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водными сводится к выбору подходящих семейств базисных 
функций ;(х) в представлении приближенного решения (19.33) 
и к выбору подходящего метода решения задачи Коши (19.37), 
(19.39) для системы линейных ОДУ первого порядка (с постоян- 
ной матрицей), поставляющей функциональные коэффициенты 
этого представления. 

В связи с тем, что в описанном способе решения уравнений 
в частных производных осуществляют дискретизацию по одной 
переменной, оставляя другую переменную изменяющейся не- 
прерывно, такие методы называют полудискретными. Однако в 
большинстве случаев применения метода прямых получающиеся 
в них системы ОДУ решаются не аналитически, а численно, т. е. 
фактически производится дискретизация и по другой перемен- 
ной (что делает название иолудискретный лишь относительно 
оправданным). 

Ясно, что для повышения точности приближенного реше- 
ния, получаемого методом прямых, следует увеличивать число и 
узлов сетки промежутка [0,/] изменения переменной х, т. е. уве- 
личивать число базисных функций $;(х). Но увеличение п не- 
пременно повлечет за собой увеличение числа жесткости © сис- 
темы ОДУ (19.37) (см. определение 16.5 в $ 16.6), что, в свою 
очередь, делает ее численное решение все более затруднитель- 
ным. С одной стороны, рост размерности системы (19.37) призы- 
вает привлекать для ее решения численные процессы более вы- 
соких порядков (чтобы объем вычислений находился в разумных 
пределах); с другой стороны, одновременное увеличение ее 
жесткости с ростом и требует применения более устойчивых 
численных методов (а это, как мы знаем на примере А(@)- 
устойчивых чисто неявных методов, см. 8 16.7, равносильно 
понижению их порядка) и более мелких расчетных шагов по пе- 
ременной /[. Так что, как и во многих других вычислительных 
ситуациях, здесь важно суметь найти компромисс. 

На той же задаче параболического типа (19.18), (19.19), 
(19.32) рассмотрим теперь конечноразностный подход к по- 
строению метода прямых. На отрезке [0, /| зафиксируем равно- 


а 1 
отстоящие точки х; =Ш (1=0,1,й ‚п) с шагом й=-— и будем 
и 


искать приближенные решения и(х;, г) данной задачи на опреде- 


ляемых этими точками прямых х=х; (1=12,й ‚п-1) в области 
1 > 0 (рис. 19.2). 
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р р 
0 м 0 щамат & 
Рис. 19.2. Прямые, на которых ищутся приближенные решения задачи 
(19.18), (19.19), (19.32) полудискретным методом прямых 


Замораживая в уравнении теплопроводности (19.18) пере- 
менную Г, ко второй производной по переменной х применим 
простейшую формулу симметричной аппроксимации (13.20): 


д?и(х, 1) __ и(х- й, г) — 2и(х, + и(х +, 1) 
дх2 12 
Подстановка формулы (19.40) в правую часть уравнения (19.18) 
при х=х; (1=12,й ‚п-1) дает и-—1 уравнений вида 


Чи(х!, 1) _ а? 
Ге 2 
Отбросим в них слагаемые О(#?) и учтем в первом и в послед- 
нем уравнениях краевые условия (19.32), согласно которым 
и(х0,0)=0, и(х,, 0 =0. 
Тогда, вводя для простоты функции переменной /{ 
у; (Ю = и(хьо, (19.41) 


приходим к системе обыкновенных дифференциальных уравне- 
ний 


+0(1?). (19.40) 


[мох О) = их, дин, 0]+ 0). 


(1 2 
т аа +20 
4; ( 2 : 
ан -2+уыЬ 1=51,"-2, 940) 
Фи—1(1 2 
ПО аз, 29, 
с начальными условиями 
(0) (-ыбхь0)) = 96, Г-ЬЗ и — (9.43) 
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получающимися из заданного начального условия (19.19). Ко- 
ротко эту систему ОДУ можно записать в векторно-матричном 
виде 


у’= Ау, (19.42а) 
где 
100 у (0) (0 
21—12 00 „| ‚|0 
— а хм ‚У= , 
еее [ [ 
И: у, 10) у 1 (0) 


причем (и-Пх(и-1)-матрица А симметрична и имеет трехдиа- 
гональную структуру. 

Не составит большого труда получить аналитический вид 
решения системы (19.42) рассматриваемого конечноразностного 
метода прямых. С этой целью введем числа 


1 


2 г 
Я; = = (2-2с03-л), 1=1,2,й ‚п-1 (19.44) 
й и 


и векторы 


Г 
$; = о луз луй ; эти) ‚ 1=Ь2,й ,и-1 (19.45) 
и 


и я, что при одинаковых значениях 7 они образуют соб- 
ственные пары матрицы А системы (19.42а). 
Действительно, так как 


зт-Ал-зт-Ал.с05--л 


и и и 
2а2 зт2йл— зт 27 л-с0$-2л 
#8; =- 2 и п 
# | сочно лоныево 
зп д -зт Ид. соз-Рл 
п п п 
и 
= Эйи-ь Глаз 
п 
а? 22 в м 
А$; =— п п |= 
арена 
зп ж-25тИ Ид 
п 
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—25щт-2л+25т-л-с05--л 


и и и 
а? —25т А+ 2. созРл 
|| ооо ль сны 
=Ззше-ь дз п 2 шИх 


зт--л —-зт--л-с0$-- 


п п п 
2а2 зт2л — 22 л -созРл 
— 9 и и п , 
т р ИИ 
К $1 1 д со л 


то 
Аз; =18; УГ, 2,Й ‚п-|. 


Анализируя собственные числа (19.44) матрицы А, видим, 
что они отрицательны и различны. Следовательно, общее реше- 
ние однородной системы ОДУ (19.42а) через эти числа и отве- 
чающие им собственные векторы (19.45) можно представить в 
виде 


У(1) = се" $1 + сое) +Й + с, ле”. (19.46) 


Для выделения из него нужного частного решения, т.е. для на- 
хождения конкретных значений произвольных постоянных 
С], С2,й ‚с, привлекаем начальные условия (19.43), составляя 


с их помощью линейную алгебраическую систему относительно 
искомых значений. 

Можно воспользоваться и готовой формулой представления 
решения У({) задачи Коши (19.42)—(19.43) [23]: 


9) = $ ае(е*" )$у(0), 


где $ := ($1;$2;й ;$„1) — квадратная матрица, столбцами кото- 
рой служат собственные векторы (19.45), а 


У(0):= (1 (0; 5>(0)5й ;ъ,1(0))" 


— вектор значений начальной функции ф(х) в узлах х; (соответ- 
ствующий условиям (19.43)). 
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Пример 19.1. Дана задача 


2 
ди _д*и, и(х, 0) =/х(-х), хЕ[о, 1, 
08 дх2 


и(0,1)=0, и.) =0, 120. 


Рассмотрим процесс построения ее приближенных решений методом пря- 
мых в двух показанных выше версиях: конечноразностной и проекцион- 
ной. При этом ограничимся самым простейшим случаем, когда берется 
всего одна прямая, осуществляющая сечение области [0, |] х [0, оо) задания 
переменных хи /, аименно, прямая х=х| := 0.5. 


(19.47) 


Г способ (конечноразностный). Воспользуемся представлением 
(19.46) приближенного решения ъ;(Г) на прямой х = 0.5. Учитывая, что 
задача (19.47) есть частный случай задачи (19.18), (19.19), (19.32) с а=1, 
1=1, Ф(х) = Хх —х), и полагая пи=2, й=0.5, по формулам (19.44), 
(19.45) находим 


й = (2-20057)=-8, я=зш 1; 
тогда, согласно (19.46), 
У1 (В) = се^" 5 = ае 8 (19.48) 
— общее решение системы типа (19.42), выродившейся в одно уравнение 
№ 
—=-8\.. 
а”! 


Из начального для него условия типа (19.43) 


у (0) = и(ж, 0) = /0.5(-0.5) = 0.5 


подстановкой в (19.48) {=0 получаем с; =0.5, и, следовательно, иско- 
мым приближенным решением задачи (19.47) на прямой х = 0.5 можно 
считать функцию 


Я (0 =0.5е®. 
П способ (проекционный). В соответствии с формулой (19.33) 


при ип=| ищем  приближенное решение в виде функции 
и1 (х, 1) =с1(1)Ф1(х). В качестве базисной функции ф\(х) возьмем первую 


функцию из семейства функций ф,(х) = х' (1-х), удовлетворяющих дан- 
ным однородным краевым условиям. Дважды дифференцируя выбранную 
функцию $! (х)= 50 —х), получаем ф/(х) =-2. Таким образом, в роли А 
в уравнении (19.36) выступает 91 (х1) = 0.5(1- 0.5) = 0.25, а в роли В — 


а?Ф"(х )=-2. Значит, в представлении приближенного решения 
аш (х, 0) = х- х)с1 (0) (19.49) 
функция с! (1) должна находиться как решение уравнения 


0.25с1(1)=-2с(#) или, проще, с1(1) =-8с1 (0. 
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Присовокупив к этому дифференциальному уравнению начальное условие 


типа (19.39), т.е. 
с1(0) = 4\/0.5(1- 0.5) =2, 


находим решение полученной задачи Коши для ОДУ: 
(д =2е. 


Подстановкой этого выражения с|(!) в (19.49) получаем приближенное 
решение 

и (х, 0) = 2х(1- хе 
(при х=0.5 совпадающее с решением (1), найденным предыдущим 
способом). 


Если высказанное несколькими страницами ранее суждение 
о возрастании жесткости систем ОДУ (19.37) с ростом их раз- 
мерности в методе прямых проекционной природы, не было дос- 
таточно обосновано, то для конечноразностного метода прямых, 
сводящегося к решению систем ОДУ вида (19.42), число жестко- 
сти может быть точно подсчитано. 

Действительно, в силу вещественности собственных чисел 
(19.44) матрицы А системы (19.42а), определенное в $ 16.6 чис- 
ло жесткости © системы ОДУ, рассматриваемое как функция 
размерности и —1 этой системы, есть 


2 = 
тах {|;} 452-2605" — я) 


ей и 2 
А = 
О а; (2 2оозл) 
й п 

1+ 50$ соз2 7 
_ п _ 2п. 
[—в05 зт2-® 
п 2и 


Так как при и —> © имеет место эквивалентность бесконеч- 


но малых зт-” и -®, значит, 2(п-1)——>о со скоростью 
2п 2п по 


0? ) что говорит о быстром ухудшении обусловленности сис- 


тем с ростом и. 

В данном конкретном случае применения конечноразност- 
ного метода прямых жесткость получающихся систем ОДУ не 
играет роли, поскольку для этих систем известны аналитические 
решения. Однако следует иметь в виду, что здесь намеренно рас- 
сматривалась простая задача, чтобы не затенять суть метода и 
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выявить его характерные черты. На самом деле область прило- 
жения метода прямых весьма обширна, причем употребляется он 
чаще всего как сугубо численный метод, где явление жесткости 
уже нельзя не учитывать. Особенности при применении метода 
прямых к уравнениям в частных производных различных типов 
имеются, но они не столь принципиальны. Более подробно об 
этом методе, его точности и разновидностях см., например, в [20, 
62, 100 идр.]. 


19.5. ВАРИАЦИОННЫЕ МЕТОДЫ. 
МЕТОД РИТЦА (ОБЩАЯ СХЕМА) 


В гл. 17, посвященной краевым задачам для ОДУ, мы лишь 
упомянули о существовании метода Ритца, реализующего вариа- 
ционный подход к построению приближенно-аналитических ре- 
шений (см. замечание 17.6 в $ 17.5), отдав предпочтение освеще- 
нию метода Галёркина, во многих случаях приводящего в итоге к 
тем же результатам. Здесь попытаемся вкратце отразить основ- 
ные моменты, касающиеся идеологии вариационных методов и, 
в частности, метода Ритца, служащего, как и метод Галёркина, 
фундаментом для метода конечных элементов (применительно к 
ОДУ последний уже рассматривался в $ 17.6). При этом, как и 
при описании метода Галёркина, сначала поднимемся на уровень 
функционального анализа. 

Пусть требуется найти приближенное решение уравнения 


Гу=Х, (19.49) 


где Г: О(Г)< НН — линейный оператор, Н — вещест- 

венное гильбертово пространство (в общем случае бесконечно- 

мерное). Предполагаем, что это операторное уравнение имеет в 
* 


ОГ.) единственное решение у , что обеспечивается, например, 
требованием положительности оператора Г в смысле выполне- 
ния условия [20, 126 и др.] 

(Гу, у)>0 УуеБ(Г), причем (Гу, у)=0>у=0. 

Данному уравнению (19.49) сопоставляется какой-нибудь 
функционал .Л У] : Н > В, такой, что он ограничен снизу и дос- 
тигает своего минимального значения „/» в единственной точке, 

* 
совпадающей с искомым решением у уравнения (19.49). Тогда 
исходная задача в постановке (19.49) сводится к решению экс- 
тремальной задачи 
Лу|->тт, уеД(р. (19.50) 


Можно сказать, что здесь осуществляется подход, который ха- 
рактерен для классического вариационного исчисления [190, 
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196], где как раз наоборот, поиск экстремалей функционалов 
сводится к решению уравнений в вариациях функционалов (ана- 
логах дифференциалов функций). 

Разнообразие методов, опирающихся на сведение задач ви- 
да (19.49) к задачам вида (19.50) и называемых вариационными 
методами, очевидно, связано и с тем, что можно конструиро- 
вать разные функционалы Лу], обладающие нужными свойст- 
вами, и с тем, что можно по-разному понимать близость при- 


ближенных решений У задачи (19.50) к точному решению у 
* — 
(например, или в смысле малости нормы | -З, или в смысле 


ро * 
малости разности ЛЯ-Лу | или еще в каком-либо смысле), и 
с тем, что можно по-разному строить процессы получения при- 
* 


ближений Уку. 
Если оператору Г в (19.49) сопоставляется функционал 
ЛУ] в (19.50) вида 


Лу =иу- ЛР = (1, 1) -2А, Р-Р, (19.51) 


т.е. функционал, который естественно назвать квадратичным, то 
соответствующий вариационный метод называется методом 


* 
наименьших квадратов ). Совершенно очевидно, что такой 
функционал всегда имеет минимум на множестве О(Г), и в слу- 
чае, когда уравнение (19.49) имеет единственное решение 


УЕ ОГ), то это решение 


У =ае тт ЛУ], причем Лу]= =, 
уЕБ(Е,) 


Другим часто используемым в (19.50) функционалом явля- 
ется так называемый функиионал энергии [47 |: 


Лу]= (Ру, у)-20, Л). (19.52) 


Взаимно однозначное соответствие между решениями задачи 
(19.50) с Лу] вида (19.52) и задачи (19.49) устанавливается при 
более жестких требованиях к оператору Г, чем в случае исполь- 
зования функционала (19.51), в частности, при условии симмет- 
ричности и положительной определенности оператора Г 


* 

к минимизации таких функционалов в конечномерных простран- 
ствах, представлявших там собою просто функции нескольких перемен- 
ных, мы уже приходили ранее при решении разных задач: при решении 
систем конечномерных нелинейных уравнений ($ 7.6), при решении пере- 
определенных СЛАУ ($ 10.1), при подборе параметров эмпирических 
функций ($ 10.1), при построении обобщенных многочленов наилучших 
среднеквадратических приближений ($ 10.2). 


7И 


(т.е. если 
(Ги, у) = (и, [^) Уи, эе БЕ) 
и, кроме того, 


Зу>0: (Иию>Ум УиЕБС). 


Вариационный метод, основанный на минимизации функционала 
(19.52), называют энергетическим методом [4А7, 126]. 

Заметим, что часто вместо функционала энергии вида 
(19.52) (иначе, функционала энергетического метода [126]) в 
вариационной задаче (19.50) можно встретить функционал более 
общего вида [20, 125, 148, 17 


Лу]|= (Гу, у)- (» Л) (У, У), 


определенный в комплексных гильбертовых пространствах (т.е. 
в пространствах, для которых (у, /) = (1, у)) и совпадающий с 
(19.52) в случае вещественных гильбертовых пространств. 

Также следует отметить наличие связи между энергетиче- 
ским методом и методом наименьших квадратов: при определен- 
ных условиях уравнение (19.49) равносильно уравнению 


| ГУ=Е У 
(где Г — оператор, сопряженный к оператору Г), решение ко- 


торого энергетическим методом означает минимизацию функ- 
ционала 


* * 
(ль, ›}- ЗЕ, ›)=Му- Р-Р, 
который лишь постоянным слагаемым АР отличается от 
функционала (19.51) метода наименьших квадратов. 

Не вдаваясь в детали, существенные при решении вопросов 
об одновременном существовании и единственности решений 
исходной задачи (19.49) и ее вариационной формулировки 
(19.50), примем за основу энергетический метод и схематично 


рассмотрим один из способов построения приближенных реше- 
ний задачи минимизации (19.50), связываемый с именем 
В.Ритца”, предложившего этот способ в 1908 г. 

В условиях симметричности и положительности оператора 
[, требуемых, как указано выше, для применения энергетиче- 
ского метода, на элементах множества О(Г.) определяется энер- 
гетическое скалярное произведение 


[м, у] = ([и,у) Уи, уе БГ) 


* 

) Ритц Вальтер (1878—1909) —физик и математик. Родился и учился 
в Швейцарии, продолжил обучение и далее работал в университетах Гер- 
мании. 
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и, соответственно, энергетическая норма 


= м, и] = (Гм, и). 


В этой метрике множество О(Г), ставшее унитарным простран- 
ством, дополняется до полного, и построенное таким образом 
гильбертово пространство Ну называется энергетическим про- 


странством; при этом доказывается, что если иеН|, то и 
ИЕН. 
Выберем в пространстве Ну, последовательность элементов 


Ф1, Ф2,Й Ф,Й , (19.53) 
называемых координатными элементами, таких, что: 
1) при любом и элементы $1, Ф2,й ф„ линейно независимы; 
2) система элементов (19.53) полна по энергии, т.е. 


УиеЕН, У=>0 ЭЗппЕМ З{а,л „аи, [6% ЕВ: 5. 


то 
и- оу 
= 


По методу Ритиа приближенное решение вариационной 
задачи (19.50) с функционалом (19.52), а значит (в оговоренных 
условиях), и исходной задачи (19.49), ищется в виде 


и 
Я’ — Ус; , (19.54) 
Е 


где числа с; (1=1,2,Й ‚п) — коэффициенты линейной комби- 
нации и первых координатных элементов последовательности 
(19.53) в представлении (19.54) — подбираются такими, при ко- 
торых 


п 
[и = шт Ус. 
СЕВ, #1 
Следовательно, задача минимизации функционала энергии 
(19.52) сводится к задаче минимизации функции и переменных 


п и И п 

Есрьй ‚с„)= ЛУсфИ = [ль ен) - Фен 7 (19.55) 
Е ыы ри 

которая, в свою очередь, с учетом предъявленных к линейному 

оператору Г требований заменяется равносильной задачей ре- 

шения СЛАУ 


(Гл, Фудс + (Еф, Ф2 )с2 +й + (91, Фи си = (91, Л), 


(Фо, Фи) + (262, Ф2)е2 +В +(ЁФ>, Фи)си = (ф>, Л), (19.56) 


(1, 91 1 + (Фр, Ф2)с> +й + (Фи, Фит = (Фи, Я) 
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ыы < 
Эта система ), называемая системой Ритиа, получается при- 
ОЕ(с,й ‚с,) 
равниванием к нулю производных — "№? ”^ (К =1,2,й ‚п), 
Ск 

что обеспечивает выполнение необходимых, а в данном случае и 
достаточных условий минимума функции (19.55); ее однозначная 
разрешимость вытекает из линейной независимости координат- 
ных элементов фу;. 


Улучшение качества приближенных решений у, (19.54), 
получаемых процессом Ритца, (а если говорить более строго, не- 


® 
возрастание энергетических норм р у [126]) с ростом числа 


п используемых координатных элементов из (19.53) есть следст- 
вие сепарабельности исходного гильбертова пространства Н и 
второго требования к системе координатных элементов, т.е. ее 
полноты. 

Итак, вариационный метод Ритца можно уложить в сле- 
дующую схему связи задач, порождающих одна другую: 


Решение операторного уравнения 


Минимизация функционала 


Выбор системы координатных элементов 


[Минимизация функции и переменных | 


Решение системы линейных алгебраических уравнений |. 


При этом некоторые промежуточные задачи нужны, фактически, 
лишь для понимания того, откуда берется следующая. Собствен- 
но, для формального получения приближений по методу 
Ритца требуется лишь выбрать подходящие элементы 9; в пред- 
ставлении (19.54) и решить систему (19.56) с симметричной по- 
ложительно определенной матрицей, чтобы найти оптимальные 
коэффициенты этого представления у, (разумеется в предполо- 
жении, что уже есть вариационная постановка исходной задачи). 


*) Такой вид она имеет в предположении, что все ф; ЕД(Г). В 6о- 
лее общем случае ф;ЕНу, в системе (19.56) вместо (Ёф;, ф;) фигуриру- 
ют энергетические скалярные произведения [ф;, Ф 7] что связано с тон- 
костями процедуры пополнения пространства (Г). 
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Полное совпадение системы Ритца (19.56) с системой 
(17.59)—(17.60) метода Галеркина для нахождения коэффициен- 
тов с; приближенного решения вида (17.57), идентичного 
(19.54), для операторного уравнения (17.56) того же, что и 
(19.49), говорит о близости методов вариационной и проекцион- 
ной природы. При этом можно указать литературные источники, 
где метод Ритца вписывается в теорию проекционных методов 
[47, 148], но иногда наоборот, проекционные методы такие, как 
метод Галеркина или более общий метод моментов, называют 
вариационными [117]; параллельное изучение этих методов см. в 
[81]. Считается, что метод Ритца имеет более узкую сферу при- 
менения, поскольку предъявляет более жесткие требования к 
оператору Г задачи (19.49), чем метод Галеркина, но имеет пе- 
ред последним то преимущество, что в рамках этого метода воз- 
можно получение более эффективных оценок погрешностей 
приближенных решений. 


19.6. МЕТОД РИТЦА ДЛЯ ДВУМЕРНОЙ 
ЗАДАЧИ ДИРИХЛЕ 


Естественной сферой приложения энергетического метода 
и, в частности, метода Ритца, общее представление о которых 
дано в предыдущем параграфе, являются краевые задачи для са- 
мосопряженных уравнений эллиптического типа. Чтобы понять, 
как реализуется метод Ритца на конкретных задачах, рассмотрим 
одну из наиболее простых подходящих для этого случая задач, а 
именно, задачу Дирихле для уравнения Пуассона (19.5) в огра- 
ниченной открытой области © точек (х;у)еЕ› с кусочно- 
гладкой границей Г и однородными краевыми условиями. При 
этом для упрощения привязки этой задачи к вариационной фор- 
мулировке, умножим уравнение (19.5) на -1, и вместо 
— Г (х, у) будем снова использовать Х(х, у). 

Итак, пусть требуется вариационным методом найти при- 
ближенное решение задачи 


2 2 
ии - бл, у) при (вуео, (19.57) 

0х ду 
и(х, у) =0 при (х; у)ЕГ, (19.58) 


где функция Ё(х, у) предполагается суммируемой с квадратом в 
области ©. 

Сопоставляя задачу с общей постановкой в операторной 
форме (19.49), примем за исходное пространство Г. (<) функций 
двух переменных и„_х, у), суммируемых в © с квадратом (как 
известно, гильбертово [45, 148, 171 и др.|), а оператором Др, 
действующим в этом пространстве, будем считать оператор Лап- 
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ласа, взятый с противоположным знаком, т.е. полагаем, что в 
* 
уравнении (19.49), примененном к данному случаю ), 


2 2 
Ги =-Ли = 2. и, би 2 (19.59) 
дх? * ву? 


Тогда областью определения Ш0([) введенного равенством 
(19.59) оператора Г является сужение пространства Н на мно- 
жество таких функций, которые обладают в области @ нужной 
гладкостью (например, дважды непрерывно дифференцируемы) 
и на ее границе Г обращаются в нуль. 

Так как скалярное произведение в пространстве /. (62) есть 


(му) = [уа@ =[[ м, уу(х, удахау, (19.60) 
[ [Ф) 
то в соответствии с (19.59) 
д?и ‚ д?и 
Ги, у) =-—||уАиаФ =- ||уС— += Э)ахау. (19.61) 
Г 1 й * д’ 


Пользуясь этим, покажем симметричность и положительность 
оператора /[,, что, согласно $ 19.5, нужно для эквивалентной ва- 
риационной постановки задачи (19.57)—(19.58). 

Для установления факта симметрии Г, рассмотрим следую- 
щую разность скалярных произведений вида (19.61) на множест- 
ве функций из ОГ): 


([м, у) (Гл, и) = - [[уДиаО +|[иДуаО = 


[Ф) [Ф) 
2 2 
-- (2 +й 2 - Че а = то, у)ахау, 
“бу? бх_ ду о 
где 
2 2 2 
ТС, у) = ее 2+2 - 
ду 0х ду 
9 [,0и „0, 9 | „ди „д 
2 а [би 2) 


* 

) Роль искомого элемента у в обозначениях предыдущего парагра- 
фа выполняет и = и(х, у), поскольку для у здесь традиционно отведено 
место второй независимой переменной. 
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(последнее равенство легко проверяется справа налево). Далее 
применяем известную формулу Грина, согласно которой 


д 
Л Е > Ра - р + О4у, (19.62) 


полагая в данном случае 
ди _ „0 


и получаем 


(ль у) — (м, о --1. ф- (2% „2, 


д" ") Хх вх 
Так как функции и иу ие в нуль на Г, то последний 
интеграл равен нулю, т.е. (Г, у) = (Гм, и), что говорит о симмет- 


рии Г. 
Теперь покажем положительность оператора Ё. По форму- 
ле (19.61) имеем 


2 2 
([и,и)=-[| [2 + о =- [| 5(х, удахау, 
о \9^ д о 


где, очевидно, справедливо следующее выражение подынте- 
гральной функции: 


2 
_ | 9?и _ д?и 22) + 2. ыы 
5(х, у) = 12 2 - 5-5. С" о, | (5 5) 
Это позволяет преобразовать скалярное произведение 
(Ги, и) (опять привлекая формулу Грина (19.62)) так: 


(Г, и) = 2) Вии + 1) + +5] 4 — 


ду 


ыы 1 2) + а $ 1 Те + @ в5 (19.63) 


Криволинейный интеграл в последнем выражении равен нулю, в 
силу (19.58), а двойной интеграл неотрицателен, в силу неотри- 
цательности  подынтегральной функции; — следовательно, 
(Ги, и) > 0. Так как 


2 9и 0, 
ие) вв > к 
ду _ ) 
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функция и(х, у) = сопя! при любых (х; у)Е О, авсилу ее непре- 
рывности, при любых (х;у)ЕО=О_ Г. Но на границе Г 
функция и равна нулю по условию; значит, она равна нулю во 
всей области О, т.е. 

(ши)=0 < и=0. 


Итак, введенный равенством (19.59) оператор Г симметри- 
чен и положителен в ©, что позволяет свести решение задачи 
(19.57)—(19.58) к минимизации функционала вида (19.52). По- 
скольку предыдущие преобразования, приводящие к формуле 
(19.63), показали, что для определяемых постановкой задачи 
функций и справедливо выражение 


(и, и)= й () + (8) ие (19.64) 


(вошедшее в литературу как интеграл Дирихле [62, 81, 165]), 
функционал энергии, подлежащий минимизации, есть 


о [© и} + + (=) — и} (х, У |6. (19.65) 


В общем, для последующего построения приближений к реше- 
нию данной задачи методом Ритца он и не нужен, так как для 
этого достаточно воспользоваться заготовками предыдущего па- 
раграфа, а вот вид этого функционала, не содержащего вторых 
производных, говорит о возможности получения этим методом 
решений (в обобщенном смысле) меньшей гладкости, чем гар- 
монические функции. 

Ставя цель получить приближенные решения данной задачи 
Дирихле методом Ритца, т.е. найти при некоторых фиксирован- 
ных ие М функции вида 


п 
ии (х, у) = Хех У) (19.66) 

= 
(в соответствии с представлением (19.54)), которые в идеале при 
п-—>5 должны доставлять минимум функционалу (19.65), сле- 
дует понимать, что во многом успех зависит от того, насколько 
удачно выбрана последовательность координатных функций 
ф; =ФИх, у), 1ЕМ. При их подборе, как правило, приходится 
ориентироваться на конкретный вид области О (которая для 
обоснованного применения такого метода должна быть доста- 
точно простой), по возможности, учитывать какие-то свойства 
решения (например, четность), проверять систему {0;} на ли- 


нейную независимость и полноту. На этот счет имеются некото- 
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рые общие соображения. Например, в [81] доказывается, что ес- 
ли в области О задать непрерывную функцию @ = @(х, у), та- 
кую, чтобы в О она имела непрерывные производные первого 
порядка и, кроме того, была положительна в области © и обра- 
щалась в нуль на ее границе Г, то последовательность функций 
вида 


20 =@, Ф=@х, ф=@у, $3 =@х?, Ф4д =@ Ху, й , (19.67) 
представляющих собой произведения заданной функции @ (х, у) 
на произведения всевозможных степеней переменных х и у, от- 
вечает требуемым свойствам линейной независимости и полноты 
в множестве О(Г), где задан оператор Лапласа, с метрикой про- 
странства [.(©). В качестве функции @(х,у), например, для 
прямоугольной области [-а, а]х[-6, 6] может быть взята функ- 
ЦИЯ 


@(х, у) =(? а? (у? -Ь?); (19.68) 
ДЛЯ круга радиуса г [® центром в начале координат к 
2 2 2 


@ (х, у) = -х“-у“. 

Наряду с полиномиальными координатными функциями в 
методе Ритца применяют также тригонометрические функции 
[125]. Так, в случае прямоугольника [0, а]х[0, 6] полной систе- 
мой линейно независимых функций, пригодных для поиска при- 
ближенных решений в виде (19.66), является последовательность 
функций, порождаемая формулой [47] 


Фи (х, ›)=ят(ких) (72 К, ЕМ. 


В случае сложного контура границы Г области © при построе- 
нии системы координатных функций применяют технику 
К-функиций (функций В.Л.Рвачева), основанную на использова- 
нии алгебры логики [143]. 

Если подходящие координатные функции $ф; для выраже- 
ния (19.66) выбраны, остается: подсчитать коэффициенты ли- 
нейной алгебраической системы (типа 19.56) 


п 
Хаус, =Ы, = 2,й „п (19.69) 
я 


по формулам (соответствующим выражениям скалярных произ- 
ведений (19.61), (19.60)) 


д°Ф; 0°9; 
ау = (Г; Ф;)= -[[о, — —. 
о дх 


(при подсчете а;; можно учесть (19.64)), 


акау (19.70) 
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в; = (фь Л) = [ФЛ уха, (19.71) 


о 
найти из системы (19.69) числа с; (1=1,2,й ‚п) и подставить их 
вместе с выбранными функциями ф; в форму приближенного 
решения (19.66). 


Пример 19.2. Методом Ритца найдем приближение и (х, у) к ре- 
шению и(х, у) задачи Дирихле для уравнения Пуассона 


2 2 
би би, (19.72) 
0х д 
в квадрате [-1, х [-1, 1] при условии, что и(х, у) = 0 наего границе. 
В соответствии с одной из приведенных выше рекомендаций по вы- 


бору координатных функций зададимся функцией д (х, у) = (2 _ 16/2 - 1) 
вида (19.68) и зафиксируем две функции из системы функций (19.67): 


Фи = хе (х, у) = (53 —х)(у? 1] и 9 =у0(% = (2-10 -.. 


Найдя частные производные 


и 
Хх 

ЧЕ» =) 2. =) 
у 
2 

22 2х -5), те =2° -›), 
2 

ва ву? -1) 6 -1), 


по формуле (19.70) подсчитываем коэффициенты при неизвестных с1, со 
системы типа (19.69). Имеем (с учетом симметрии вхождения переменных 
хи увфункции фу, фо и в их производные, а также симметрии области 
О): 


020 0? 
ап (=а>2) == о * а = 
о Ох ду 


-- Ге? 962 зб? 19-263 - ха 3328, 


1-1 
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02% 0? 
а12(=а21)= [Деев ака = 
о \@ бу 


11 
=- Г? — Ц? - у? -1)+2(° - ха =0. 
—1-1 
При нахождении свободных членов В, 6> СЛАУ (19.69) принимаем во 
внимание, что вывод формул, реализующих метод Ритца, осуществлялся 
для уравнения Пуассона в записи — Ди = ЛХ (см. (19.57)), так что здесь сле- 
дует считать /(х, у) = х+у. По формуле (19.71), также учитывая симмет- 
рию, получаем 


Ы (=55)= [ФЛ = 52 — ху? - 0+ уфа =16. 


о — {5 
Таким образом, система (19.69) в данном случае есть 
3328-16 ;=1,2, 
1575 45 
откуда с =со =50к- Следовательно, искомое приближенное решение 


ио (х, у) в соответствии с формой (19.66) имеет вид 


иобь у) = ВЯ 17-13557 (7-1 


или, проще, 


и> (х, р) =.39. 508 35 (к? => -1 < +). (19.73) 


Не пытаясь делать оценок погрешности найденного решения 
и2(х, у), вычислим его невязку в одной контрольной точке (0.5; 0.5). 
Дважды продифференцировав функцию (19.73), получаем функциональ- 
ное выражение невязки 


Ди) уфы :35. [2 - 1вх+»)+ (2 _ 1) +35)+ +5; 
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ее значение в точке (0.5; 0.5) Е © равно т что совсем неплохо при 
таком малом числе координатных функций. 


19.7. О ДВУМЕРНОМ МЕТОДЕ КОНЕЧНЫХ 
ЭЛЕМЕНТОВ 


С появлением высокопроизводительной вычислительной 
техники метод Ритца вряд ли смог бы остаться серьезным конку- 
рентом рассматриваемым в следующих главах конечноразност- 
ным методам, если бы не пришло осознание того, что большие 
области задания уравнений со сложной геометрией можно раз- 
бивать на много частей простого вида (конечные элементы) и в 
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качестве координатных функций в методах Ритца и Галёркина 
использовать базисные сплайны невысокой степени, одномер- 
ные, двумерные или трехмерные в зависимости от размерности 
решаемой задачи, т.е. если бы не пришли к методу, называемому 
методом конечных элементов. С одномерным МКЭ, примени- 
мым к краевым задачам для ОДУ, мы уже познакомились в 
$ 17.6. Сразу же отметим, что двумерный МКЭ, не говоря уже о 
трехмерном, намного сложнее одномерного, и пакеты компью- 
терных программ, его реализующие, содержат десятки и сотни 
тысяч операторов [119]. Более-менее полное изложение этого 
метода можно найти в книгах [124, 135, 168, 170, 182, 191] и не- 
которых других. Наша цель — ориентируясь на подготовленные 
в предыдущем параграфе формулы (19.69)—(19.71), с помощью 
которых можно получить методом Ритца коэффициенты при- 
ближенного решения (19.66) задачи Дирихле для уравнения Пу- 
ассона (19.57)—19.58), лишь попытаться расставить основные 
вехи на пути освоения метода конечных элементов, что может 
помочь при дальнейшем его изучении или при использовании 
готовых программ, его реализующих ‚ если в этом возникнет не- 
обходимость. 

Метод конечных элементов решения двумерных краевых 
задач предусматривает несколько этапов. 

На первом этапе выполняется разбиение данной об- 
ласти ОсЕ, на некоторое число простых и однородных по 
структуре частей А, — конечных элементов. Более редко в этой 
роли выступают четырехугольники; чаще же конечными элемен- 
тами А; служат треугольники; в последнем случае, который мы 


и примем за основу, разбиение области © называют триангуля- 
цией. Если О — многоугольная область, то триангуляция про- 
изводится так, чтобы каждые два из получающихся при этом 
треугольников или не пересекались, или имели общую сторону 
или общую вершину; при этом не должно быть треугольников, у 
которых все три вершины лежат на границе Г области ©, и не 
должно быть частей многоугольника, отличных от этих А тре- 
угольных элементов (рис. 19.3). Обычно задаются или некото- 
рым числом и строго внутренних (по отношению к Г) вер- 
шин Р; (71=12,Й ‚п), общих для нескольких треугольных 
элементов из множества {Л} }, что определяет количество коор- 
динатных функций в приближенном решении (19.66) по методу 
Ритца, или некоторым числом й>0, ограничивающим макси- 
мальный линейный размер треугольника для обеспечения нуж- 
ной точности. Все эти внутренние вершины Р; (которые опреде- 
ленным образом упорядочиваются) образуют сетку узлов МКЭ, 
откуда проистекают его названия вариационно-сеточный или 
проекционно-сеточный метод. Если граница Г области О 
имеет криволинейные участки, то либо в них вписываются лома- 
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ные, т.е. предварительно формируется многоугольник, вписан- 
ный в Г, либо применяются более сложные алгоритмы МКЭ, 
допускающие использование криволинейных треугольников. 


Рис. 19.3. Пример Рис. 19.4. Вид координатной функции 
триангуляции ф; с носителем из четырех лагран- 
жевых треугольных элементов пер- 

вой степени 


На втором этапе строится система координатных 
функций 9; (1=1,2,Й ‚п), представляющих собой двумерные 
В-сплайны первой или второй степени, чаще первой. В линей- 
ном случае каждую такую функцию ф; можно изобразить в виде 
пирамиды с высотой, равной 1 и проведенной из узла сетки Р; 
основанием которой, т.е. носителем этой координатной функции, 
служит многоугольник, состоящий из треугольных элементов с 
общей вершиной Р;; за пределами этого многоугольника функ- 
ция ф; равна нулю (рис. 19.4). Каждая из боковых граней такой 
пирамиды определена над соответствующим треугольным эле- 
ментом (одним из {Л;}) и может быть описана уравнением 
плоскости, проходящей через ее вершины. Например, грань 
А,В‚5;, связанную на рис. 19.4 с элементом А;В,Р;, можно за- 
дать уравнением плоскости 


2=@:х+ ВУ+У; (19.74) 


в системе координат Оху2, причем коэффициенты а;, В+, У; в 
этом уравнении могут быть однозначно найдены, поскольку пер- 
вые две координаты у вершин 4;, В;, 5; известны как координа- 
ты узлов 4;, В,, Р; (какие-то из них могут быть граничными, т.е. 
не считаться узлами сетки), а третьи равны 0, 0 и 1 соответствен- 
но согласно определению $ф;. Аналогично находятся уравнения 
плоскостей, соответствующих боковым граням над всеми ос- 
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тальными треугольными элементами с общей вершиной Р,, в ре- 
зультате чего задается кусочно-линейная непрерывная коорди- 
натная функция ф; с конечным носителем. 

При построении кусочно-квадратичных координатных 
функций ф; при той же триангуляции уравнение поверхности 
над треугольным элементом А;В;Р; можно записать в виде 


2=а,х” + Вухучу, у? +д;х+=:у+4,. (19.75) 


Оно имеет 6 параметров; для их получения используют 6 харак- 
терных точек этого элемента, а именно, все его вершины и еще 
середины сторон. В таком случае тоже однозначно могут быть 
найдены все коэффициенты в уравнении (19.75) квадратичной 
поверхности 4;В;5; и аналогично остальные уравнения, в ком- 
плексе задающие искомую функцию 0). 

Так как аналитическое построение поверхностей (19.74) и 
(19.75) естественно считать двумерной лагранжевой интерполя- 
цией, то используемые для этого «трехточечные» и «шестито- 
чечные» треугольные элементы называют лагранжевыми эле- 
ментами первой и второй степени соответственно, в отличие, 
например, от элементов того же геометрического вида, но с ин- 
формацией о производных в узлах, что отвечает эрмитовой интер- 


ПОЛЯЦИИ °. Треугольные лагранжевы элементы называют также 


треугольниками или элементами Куранта”) ПИ. 

Линейные (19.74), квадратичные (19.75) и прочие функции 
двух переменных, определенные показанным выше образом на 
лагранжевых или иных элементах, называют базисными функ- 
циями соответствующих элементов. Для вычисления коэффици- 
ентов базисных функций вместо глобальных координат х, у 
обычно применяют локальные так называемые барицентриче- 
ские координаты [119, 191]. 


* 

) Заметим, что часто под конечным элементом понимается не про- 
сто треугольник или четырехугольник, а тройка (иначе, триплет [119]), где 
первым указывается тип простого элемента (треугольник или четырех- 
угольник), далее — число используемых в нем узлов (называемое числом 
степеней свободы) и, наконец, — пространство интерполирующих много- 
членов (обычно степени <1 или <2). 


#ж* Е 

) Курант Рихард (1888—1972) — математик польского происхож- 
дения, профессор Гёттингенского (1920—1933), а затем Нью-Иоркского (с 
1934г.) университетов, крупный специалист по краевым задачам для 
УМФ. Автор ряда книг. Им опубликована первая математическая работа, 
где используются линейные аппроксимации на треугольных элементах 
при реализации вариационного метода (1943г.). 
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На третьем этапе применения МКЭ к задаче (19.57) 
(19.58) формируется СЛАУ (19.69). При подсчете коэффициен- 
тов этой системы по формулам (19.70), (19.71) учитывается вы- 
полненное разбиение области <> на элементарные подобласти 
(триангуляция), что ввиду аддитивности интегрирования приво- 
дит к суммам двойных интегралов по всем отдельным конечным 
элементам, на каждом из которых определено столько базисных 
функций, сколько внутренних узлов этот элемент имеет своими 
вершинами. Так как за пределами определяющего ее элемента 
базисная функция, а значит, и координатная функция ( В-сплайн) 
за пределами своего носителя — нескольких элементов с общей 
вершиной, служащей узлом сетки, — равна нулю, то лишь не- 
сколько интегралов среди упомянутых будут отличны от нуля. 
Для их вычисления привлекаются какие-либо простые квадра- 
турные формулы (часто специальные). Ясно, что при большом 
числе и внутренних вершин элементов, т.е. узлов сетки, матрица 
А := (а;) линейной алгебраической системы (19.69) будет раз- 
реженной, причем структура этой матрицы (называемой в МКЭ 
матрицей жесткости [119, 135, 168, 182]), т.е. расположение в 
ней ненулевых элементов, зависит от того, каким образом зану- 
мерованы узлы и конечные элементы при триангуляции. 

Четвертый этап — это выбор подходящего метода и 
решение полученной СЛАУ. В отличие от одномерного МКЭ, 
где четко прослеживалась ленточная структура матрицы жестко- 
сти (см. $ 17.6), здесь на это рассчитывать нельзя, тем более, что 
двумерный (и трехмерный) МКЭ применяют в случаях областей 
сложного геометрического вида со сгущением сетки на участках 
с потенциально быстрым изменением искомого решения. Поэто- 
му часто при реализации МКЭ формирующиеся в нем СЛАУ ре- 
шаются итерационными методами. 

Поставленные выше подзадачи, которые приходится ре- 
шать в процессе применения МКЭ, обычно рассматриваются в 
комплексе. Использование специальных приемов разбиения дан- 
ной области на подобласти с последующим разбиением их на бо- 
лее мелкие конечные элементы позволяет учитывать особенно- 
сти рассчитываемой модели и готовить для дальнейшей 
обработки нужные структуры данных [120], а итерационное ре- 
шение СЛАУ на последовательностях, получающихся при этом 
сгущающихся сеток делает процесс решения более эффектив- 
ным, поскольку решения, соответствующие более редким сет- 
кам, можно принимать за начальные приближения для решений 
на более густых сетках, и, кроме того, процедура сгущения слу- 
жит основой для апостериорного контроля точности [191]. 
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УПРАЖНЕНИЯ 


19.1. А) Завершите построение функции и| =и1(х, у), участвую- 
щей в нахождении решения и= и + и› задачи Дирихле для уравнения Ла- 
пласа методом разделения переменных ($ 19.3), считая, что задающие 
краевые условия (19.23) функции $1(х) и $>(х) имеют коэффициенты 


. пл 
Фурье в разложении по зт — х соответственно „и Ди. 


а 

Б) Аналогично построению функции и! получите функцию 
и =ио(х, у), опираясь на краевые условия (19.24), и запишите оконча- 
тельный вид решения и задачи (19.21)—(19.22). 


19.2. Продолжите пример 19.1 $ 19.4 на метод прямых: 


а) положив и = 4 в первом способе; 


1 5 
6) положив и=2, х! - х› = во втором способе. 


19.3. Запишите расчетные формулы, по которым можно получать 
сеточные значения приближенных решений системы (19.42) метода пря- 
мых для задачи теплопроводности (19.18), (19.19), (19.32), привлекая: 

а) явный метод Эйлера; 

6) неявный метод Эйлера; 

в) метод Рунге-Кутты четвертого порядка. 


19.4. Принимая за основу ту или иную из предложенных в $ 19.4 
концепций метода прямых, рассмотрите возможность его применения к 
задаче (19.8), (19.16), (19.17) колебания струны [20, 100, 138]. 


19.5. Конкретизируйте вид функции РЁ, определенной выражением 
(19.55), в случае и=2; запишите для нее необходимые условия экстрему- 
ма и убедитесь, что полученная при этом СЛАУ есть система Ритца 
(19.56) при и=2. 


19.6. А) В примере 19.2 $ 19.6 пересчитайте коэффициенты а11, 
а22, пользуясь интегралом Дирихле (19.64); убедитесь в совпадении ре- 
зультатов. 


Б) Методом Ритца найдите приближение ил (х, у) к решению задачи 
Дирихле примера 19.2, выбрав еще две подходящие координатные функ- 
ции из системы функций (19.67). Вычислите значение невязки функции 
ид (х, у) в точке (0.5; 0.5) и сравните его с имеющимся в примере значени- 


ем невязки приближения и. (х, у). 


19.7. Считая единственным внутренним узлом сетки точку 
В (0.5; 0.5), сделайте триангуляцию квадрата |[- 1, Пх [-1, 1] и методом ко- 
нечных элементов найдите приближенное значение и(0.5, 0.5) решения 
и(х, у) однородной задачи Дирихле для уравнения Пуассона (19.72). 
Сравните результат со значением и (0.5, 0.5), подсчитав последнее по 
формуле (19.73), полученной в примере 19.2. 
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ГЛАВА 20 |КОНЕЧНОРАЗНОСТНЫЕ 
МЕТОДЫ РЕШЕНИЯ 
ЭВОЛЮЦИОННЫХ ЗАДАЧ 


С помощью ключевых терминов метода конечных разно- 
стей таких, как сетка, шаги сетки, узлы (внутренние и гранич- 
ные), слой, шаблон разностной схемы и т.п., описываются 
процессы построения явных и неявных разностных схем для не- 
стационарных задач на основе простейших конечноразностных 
аппроксимаций производных, изучавшихся в гл. 13. Делается это 
на примерах одномерного и двумерного уравнений теплопровод- 
ности и волнового уравнения; уравнение переноса затрагивается 
в той мере, в какой это необходимо, чтобы обозначить пробле- 
му возникновения разрывных решений и увидеть потребность в 
консервативных схемах. Особое внимание уделяется конструи- 
рованию экономичных схем, в частности, методу переменных 
направлений. Условная или абсолютная устойчивость рассмат- 
риваемых разностных схем лишь констатируется (с указанием 
ссылок на соответствующую литературу). 


20.1. НЕКОТОРЫЕ РАЗНОСТНЫЕ СХЕМЫ 
ДЛЯ УРАВНЕНИЯ ТЕПЛОПРОВОДНОСТИ 


Будем рассматривать построение, терминологию и харак- 
терные черты метода конечных разностей ДЛЯ уравнений в ча- 
стных производных (сначала для нестационарных задач) на 
примере неоднородного уравнения теплопроводности 


ди ди (ки), хе, И, (10,Т], (20.1) 
[61 ах? 
сопровождаемого начальным по временной переменной 
и(х, 0) = 9(х) при хЕ [0,1] (20.2) 
и краевыми по пространственной переменной х 
и(0, 1) = <(), и(1,1)= В(Г) при 1=Е[0,Т] (20.3) 


условиями. Физической интерпретации этой задачи мы касались 
в предыдущей главе. 

Как видим, область ©, на которой определена данная зада- 
ча, представляет собой прямоугольник (0, /)х (0, Т) в системе 
координат О»х!, а ее граница Г состоит из отрезков прямых 
х=0, х=/[, 1[=0 (отрезок прямой {1 =Т здесь к границе Г не 
относится). Разобьем этот прямоугольник на прямоугольные же 
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части прямыми х=х; и { = +, параллельными осям ОЕ и Ох со- 
ответственно, где: 


‚тео, п; (20.4) 
Ш=кт, т=-, К=О,ЬЙ т. (20.5) 


Точки (х;; к) ЕО = ОГ, лежащие на пересечении этих пря- 
мых, называются узлами: внутренними, если они принадлежат 
области ©, и граничными, если они лежат на ее границе Г (см. 
рис. 20.1, где внутренние узлы помечены кружочками, а гранич- 
ные — крестиками; закрашенные кружочки не относятся ни к 
внутренним, ни к граничным узлам). Совокупность всех узлов в 


О называют сеткой для данной задачи (обозначим ее О;), а 


числа Й и т, фигурирующие в (20.4), (20.5), называют шагами 
сетки по переменным х и [Е соответственно. Узлы, лежащие на 
одной прямой / =, при фиксированном К =0,1,й , т, называют 
слоем. 


Рис. 20.1. Сетка о; для конечноразностного метода 
решения задачи (20.1)—(20.3) 


Каждой функции у(х, Г), непрерывной в области О, отвеча- 
ет единственная таблица ее значений у = у(х;, 1) в узлах сет- 


ки, называемая сеточной функцией (соответствующей функции 
у(х, Г)). Пометив номер второй координаты узла у сеточной 


функции верхним индексом, означающим номер слоя, таким же 
образом будем помечать сеточные функции одной временной 
переменной: 


а =а(), В:= Вар), Е=О,ЬЙ ‚т. (20.6) 


Разностный метод решения уравнений в частных производ- 
ных (или, точнее, конечноразностный, поскольку мы используем 
сетки с постоянным шагом вдоль каждой из осей, что позволяет 
привлекать конечноразностную интерполяцию) основывается на 
простой идее построения приближенных сеточных решений: 
спроектировать данное уравнение на сетку, заменяя входящие в 
него функции сеточными, а частные производные — их про- 
стейшими разностными аппроксимациями. Это проектирование 
производится следующим образом. 


Взяв за основу внутренний узел (х;;{,) сетки Оу, который 


будем называть расчетным узлом, поставим в соответствие 

входящей в уравнение (20.1) функции ©(х,Г) значение 
2. 

5“ = &(х;, 1), а частные производные Е и би заменим их 
9х 

простейшими разностными аппроксимациями. Ввиду того что 

здесь частные производные рассматриваются в фиксированной 

точке, к ним можно применить формулы численного дифферен- 

цирования функций одной переменной, изучавшиеся в гл. 13. А 


2 
именно, для производной а наиболее естественно употребить 
Ох 
симметричную формулу (13.20), согласно которой 
2 бр) 2(х;, 1) + +1 6% 
д и = и(хрль (к) ие к) их 2 .0(2). (20.7) 
дх = р 
ди 


Для приближенной замены т априори с одинаковым успехом 


можно попробовать привлечь простейшие формулы правой 
(13.15), левой (13.14) и симметричной (13.18) аппроксимации 
первой производной; соответственно им имеем: 


ди их, р) и(хь, 1) 

а ОВНА НЫЕ А 4] 20.8 
ру = с +О(+), ( ) 
ди и(х, в) и(х;, Ш) 

Ме. АКА РВ, 20.9 
5 ей 2 + О(т), ( ) 
ди и(х;, И у— и(х,, 1) 2 

а НЙ АЕ] п 20.10 
ОЕ 2т ы | ты 
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Договоримся о следующем. 

Во-первых, будем предполагать, что мы находимся в усло- 
виях, когда решение и(х,Г) данной задачи существует, единст- 
венно и обладает достаточной гладкостью. 

Во-вторых, в отличие от оговоренных выше обозначений 
сеточных функций, будем считать, что 


ий = и(х, 1), (20.11) 


т.е. чтобы не вводить другой буквы, через и обозначаем значе- 
ния сеточной функции, соответствующей приближенному 
решению и (х, Г) на сетке ©}, иначе, каркаса приближенного, а 


не точного решения данной задачи. 
2 
Подставив в уравнение (20.1) аппроксимации би по фор- 
0х 


муле (20.7) и ел по одной из формул (20.8), (20.9) или (20.10), 
отбросив погрешности аппроксимаций и учтя при этом обозна- 


чение (20.11), для расчетного узла (х;,(„) получим следующие 


уравнения: 
+1 А К К К 
и -и и -2и; +и; 
а ар, (20.12) 
* й 
К К 
и; -и; 2 ит -2и; +И 1 р. 
1 1 1 о 1+ р. (20.13) 
т й 
К-1 К-1 
и: И; 2 и 7. 2и; Е И 1-1 К (20 14) 
2т р2 : ° 


Будем теперь считать, что расчетный узел (х;; (+) смещается по 


сетке О}, те. полагаем в уравнениях (20.12)(20.14) 
1=12,й ‚п-1, К=1,2,Й ‚т-1. Учитывая, что первыми из ис- 
пользуемых в расчетах узлами должны быть точки нулевого 
слоя, а последними — т-го слоя, дополняем множество возмож- 
ных здесь значений К значением К =0 для уравнения (20.12) и 
значением А = т для уравнения (20.13). 

Сеточные уравнения, которые получаются в результате ап- 
проксимации производных в данном УМФ разностными отно- 
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шениями, в совокупности с уравнениями, аппроксимирующими 
на той же сетке начальные и граничные условия (в данном слу- 
* 


чае, с учетом обозначений (20.6), это условия ) 
и =; (=0(х;)), 1=0,ЬЙ ‚п, (20.15) 
и, и = А, К=О,ЬЙ т) (20.16) 


называются разностными схемами. Конфигурации узлов, в ко- 
торых связаны одним уравнением разностной схемы значения 
неизвестной функции — каркаса приближенного решения — на- 
зывают шаблоном разностной схемы. На рис. 20.2 показаны 
шаблоны, отвечающие разностным схемам (20.12), (20.13) и 
(20.14) (а, б и в соответственно). 


(ВА+1) (6+1) 


сю @ъю быю 

(-ЬА) (+1,Ю) (К) (-ЬА) (,Ю) (1+А) 
(5-1) (6-1) 

а) 6) в) 


Рис. 20.2. Шаблоны для параболического уравнения: 
а) явный двухслойный; 6) неявный двухслойный; в) явный трехслойный 


Введем постоянную (при заданной сетке) 
у:=а? -7- (20.17) 
и2 


и перепишем разностные схемы (20.12)—(20.14) соответственно 
следующим образом: 


м ‚ИЕ. ы 
из * = ии; 1+(1-2у)и; + 7+1 + 181 


(гдег=12,й ,и-1; К=0,1й ‚т-1); (20.19) 
—1 

ри: —(1+2у)ий + и =-м —те! 20.19 

(где? =1,2,Й ‚п-1; К=Ь2Й ‚,т); 9.1 

К-+1 К-1 А К К А 

и аш ира 4 +2 +248; (20.20) 


(где =1,2,й ,п-1; К=Ь2,Й ,т-1). 


ь Заметим, что начальное (20.2) и граничные (20.3) условия непре- 
менно должны быть согласованными в точках (0;0) и (/;0); так что в 
(20.15), (20.16) 


0 0 0 0 
и) =а =, ии = В = Фи. 
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Эти записи позволяют увидеть, как можно осуществить процесс 


заполнения (п-1)хт-таблицы значениями и;, определяемыми 
каждой из трех представленных схем. 

Учитывая, что на нулевом слое значения и’, согласно 
(20.15), известны при любом Ге {0,1,й ‚и!, формула (20.18) по- 
зволяет непосредственно вычислить все приближенные значения 


* 
и! первого слоя ). Таким же образом, привлекая наиденные зна- 
чения и! первого слоя, непосредственно можно подсчитать зна- 
чения и? второго слоя, только при этом для вычислений и? И 


и потребуется еще подставить в формулу граничные значения 


и =а! и и! = В! соответственно (см. (20.16)). Дальнейшие пе- 


реходы от слоя к слою не отличаются от этого. 

В равенстве (20.19) при А =1 и любом 1е {1,2,й ‚п-П из- 
вестна только правая часть благодаря начальным данным (20.15). 
Следовательно, для нахождения значений и; в узлах первого 
слоя нужно решить СЛАУ 


| | | | 
и; -@+2уди; +уищ =-Ф;- т, 
где? =1,2,й ‚п-1; и =а', ит = Д'. 
Очевидно, матрица этой системы имеет трехдиагональную 
структуру с диагональным преобладанием (1+2 >у+у), а это 


означает, что система может быть эффективно решена методом 
прогонки ($ 2.6). Значения искомой функции и в узлах второго 
слоя получаются как решение системы 


мрт -@+27)ы? + ин =-и} 187, 
где 1=1,2,й ‚п-1; и =а?, и = д, 
и так далее, т.е. всего для заполнения таблицы требуется решить 
т однотипных СЛАУ. 

Каждая из двух рассмотренных разностных схем связывает 
значения искомой функции на двух соседних слоях, откуда про- 
истекает их название двухслойные схемы. При этом разностная 
схема (20.18), представляющая собой формулу для непосредст- 
венного вычисления искомых значений очередного слоя, называ- 
ется явной схемой, а схема (20.19), требующая при 


ЕЗ 

) Эти вычисления можно производить или последовательно, одно 
за другим, полагая 1=1,2,Йй ‚и-1, или параллельно, все сразу, при этих 
же значениях 7, что говорит о естественной возможности оптимального 
использования здесь ресурсов компьютера с параллельной обработкой 
информации. 
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переходе от слоя к слою решать системы алгебраических урав- 
нений, — неявной схемой. 

Исходя из подобного принципа классификации, разностная 
схема (20.20) считается явной трехслойной схемой. Правда, 
поскольку начать процесс вычислений по этой схеме можно 
только положив К = 1, т.е. с формулы 


ИЕ 4 +2 1+9, +2%1!, (20.21) 


где значения и! (1=12,Йй ‚п-1) еще не подсчитаны, нужна до- 
полнительная связь между неизвестными и известными величи- 
нами. Такую дополнительную связь между значениями искомой 
сеточной функции трех первых слоев можно получить, напри- 
мер, беря в качестве расчетного узел нулевого слоя и применяя к 


ди. формулу несимметричной аппроксимации второго порядка 
точности (13.26). Имеем (представьте соответствующий шаб- 
лон!) 
0 1 :й 0 0 0 
—Зи; +4и; -и; — аа —2и; +и;-1 0 
1) 


ря и2 
откуда вытекает другое равенство того же вида, что и (20.21): 


2 1 
и; =4и; -270;1+(47-3)®; -27Ф- 278 . 


Сравнением правых частей последнего равенства и равенства 
(20.21) приходим к трехточечному разностному уравнению вто- 
рого порядка 


| | | 0 | 
хи (2+2); +ти =-7Ф,1+@7-2)®; - 71-18; -т81, 


решая которое методом прогонки, находим значения функции и 
в узлах первого слоя, после чего становится возможным счет по 
формуле (20.21) и все последующие вычисления по общей фор- 
муле (20.20) при К =2,3,й ‚т-1. 


20.2. АППРОКСИМАЦИЯ, УСТОЙЧИВОСТЬ, 
СХОДИМОСТЬ РАЗНОСТНЫХ СХЕМ ДЛЯ 
УРАВНЕНИЯ ТЕПЛОПРОВОДНОСТИ 


Формальная аппроксимация производных в уравнении 
(20.1) на заданной сетке Оу, а также дискретизация начальных 


(20.2) и граничных (20.3) условий в узлах границы Г области ©, 
привели к тому, что данную непрерывную бесконечномерную 
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задачу (20.1)-(20.3) мы заменили тремя разными конечномерны- 
ми задачами (20.18)—(20.20) с одинаковыми для них дополни- 
тельными условиями (20.15), (20.16). Встает вопрос: какое 
отношение имеют решения новых задач к решению исходной за- 
дачи? Можно ли быть уверенным в том, что последовательность 


решений ий каждого из сеточных уравнений (20.18)—(20.20) схо- 
дится к значениям решения и(х,Г) уравнения (20.1) на данной 


сетке О} при й->0, г->0? Ответ на поставленные вопросы 
обычно дают, опираясь на упоминавшееся в $ 16.1 утверждение 
о том, что сходимость есть следствие аппроксимации данной 
бесконечномерной задачи конечномерной и устойчивости реше- 
ния последней. При этом доказывается, что быстрота сходимости 
имеет такой же порядок относительно шага (шагов), что и поря- 
док аппроксимации. 

Установление факта и порядка аппроксимации уравнения 
(20.1), а точнее, задачи (20.1)-(20.3), рассмотренными выше раз- 
ностными схемами в предположении о достаточной гладкости 
решения и(х,Г) не вызывает затруднений. Сравнение этих схем 
в виде (20.12)(20.14) с конечномерными уравнениями, которые 
получаются в результате подстановки точных равенств 
(20.7)—(20.10) в исходное уравнение (20.1), показывает, что явная 
и неявная двухслойные разностные схемы (20.18) и (20.19) ап- 


проксимируют уравнение (20.1) с погрешностью О(т)+О 12 у 


явная трехслойная схема (20.20) — с погрешностью (=? )+ о? ) 
Так как при проектировании краевых и начальных условий дан- 
ной задачи на сетку О; искажений (зависящих от й иот т) не 
вносится, то можно считать, что с такими же погрешностями эта 
задача в целом аппроксимируется соответствующими дискрет- 
ными задачами вместе с условиями (20.15)—(20.16). Как правило, 
о рассмотренных двухслойных схемах, основанных на четырех- 
точечных шаблонах (см. рис. 20.2, аи 6), говорят, что они ап- 
проксимируют данную параболическую задачу (20.1)—(20.3) со 
вторым порядком по пространственной переменной х и с пер- 
вым по временной переменной [, и отражают этот факт записью 


погрешности аппроксимации задачи вида О? +7). Для трех- 
слойной схемы (20.20) погрешность аппроксимации составляет 


величину о? +12). 


Несомненно, погрешность аппроксимации данной задачи с 
помощью каждой из трех рассматриваемых разностных схем (в 
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другой терминологии, локальная ошибка дискретизации [138]) 
стремится к нулю при й > 0, т->0. Это называется условием 
согласованности разностной схемы и является лишь необхо- 
димым условием стремления к нулю глобальной ошибки, кото- 
рая может накапливаться по тому или иному закону от слоя к 
слою. Способность разностной схемы (естественно, при условии 
ее однозначной разрешимости) не допускать неограниченного 
увеличения ошибки в процессе измельчения сетки, грубо говоря, 
и означает ее устойчивость. Поскольку источником первона- 
чальной ошибки может служить переход к сеточным функциям 
при дискретизации исходного уравнения, а также неточности в 
начальных и граничных условиях, изучение устойчивости разно- 
стной схемы в целом разбивают, соответственно, на изучение ус- 
тойчивости по правой части, по начальным данным и по 
граничным условиям. 

Исследование устойчивости разностных схем (в смысле той 
или иной строгой формулировки, которых имеется несколько, но 
все они базируются на одном и том же понятии устойчивости) 
является наиболее сложным этапом построения конечноразност- 
ного метода. Существует ряд приемов проведения таких иссле- 
дований [20]: с помощью разностного принципа максимума, с 
помощью «индекса разностной схемы», методом разделения пе- 
ременных, изучением роста единичной ошибки и др. Сошлемся 
на распространенную литературу, где можно найти изучение ус- 
тойчивости предложенных выше схем разными приемами и в 
разных подробностях: в [13, 14, 20, 103, 154, 158, 159] — более 
подробное, на наш взгляд, изложение, в [27, 44, 47, 62, 78, 92, 
100, 126, 138, 153, 178] — менее подробное. 

Обратимся к последней разностной схеме (20.20). К ней це- 
лесообразно применить так называемую #-схему изучения роста 
единичной ошибки [20, 27, 84]. Суть ее в том, что по исследуе- 
мой разностной схеме проводят пробные расчеты, исходя из 
предположения о единственной ошибке = в значении ик, 3:2. 
вместо этого значения в расчетную формулу подставляют значе- 
ние и + = и следят за поведением ошибки на следующих (А +1)- 
м, (К-+2)-м, ... слоях. Если ошибка имеет тенденцию расти по 
модулю, то разностная схема должна быть признана неустойчи- 
вой и забракована. Такой #-анализ трехслойной схемы (20.20) в 
частном случае у = 0.5, © = 0 показывает [20], что начав процесс 


вычислений с А-го слоя с одним искаженным значением и $2, 
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1 


на следующем слое получим значение и+ с ошибкой —2=, да- 


У 
лее значение ие? будет иметь ошибку 7=, ..., зЗНачение 7+6 —= 


ошибку 1311=. Ошибка катастрофически растет (и расползает- 
ся по таблице подобно тому, как это наблюдалось с поведением 
ошибки в таблице конечных разностей, см. табл. 8.6 в $ 8.4), что 
говорит о непригодности разностной схемы (20.20), по меньшей 
мере, при у = 0.5, хотя она имеет более высокий порядок ап- 
проксимации по сравнению с двумя другими схемами. 
Исследования явной двухслойной схемы (20.18) приводят к 
одному: она устойчива при условии у < 0.5, что в соответствии с 
обозначением (20.17) равносильно требованию к шагу по времени 


га. (20.22) 
2а?2 
Разностная схема, устойчивость которой связана с некоторым 
ограничением на шаг, называется условно устойчивой. 
В отличие от явной, неявная двухслойная схема (20.19) ус- 
тойчива при любых у > 0, т.е. при любом соотношении шагов по 
времени и по пространственной переменной, в связи с чем ее на- 


зывают безусловно или абсолютно устойчивой разностной 
схемой. 


Таким образом, можно констатировать сходимость решений 
двухслойных разностных схем (20.18), (20.19) с совокупностью 
дополнительных условий (20.15)-—(20.16) к решению задачи теп- 


лопроводности (20.1)—(20.3) с погрешностью О 12 +т при лю- 
бых И->›0, т->0 в случае неявной схемы и при й->0, 
2 


т<—->0 в случае явной схемы. Очевидно, каждая из этих 
2а 
схем имеет свои достоинства и недостатки. Явная схема проще и 


требует меньше вычислительных затрат на подсчет значений од- 
ного слоя, зато таких слоев должно быть больше из-за ограниче- 
ния (20.22) на шаг по времени, чем при реализации неявной 
схемы, допускающей любое соотношение шагов, но требующей 
решения СЛАУ при подсчете значений каждого слоя. Правда, 
при этом сопоставлении не следует забывать еще о точности ап- 
проксимации данной задачи разностной схемой, которая для яв- 


ной схемы (20.18) при ограничении (20.22) теперь есть О р? ‚и 
чтобы иметь такую же для неявной схемы, нужно в ней брать 


г:= О? ) [47]. 
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20.3. ДВУХСЛОЙНЫЙ ШЕСТИТОЧЕЧНЫЙ И 
ДРУГИЕ ШАБЛОНЫ ДЛЯ ПАРАБОЛИЧЕСКИХ 
УРАВНЕНИЙ 


Возьмем за основу следующего построения явную и неяв- 
ную разностные схемы для уравнения (20.1) в их исходной фор- 
ме (20.12) и (20.13). Перепишем равенство (20.13) в виде 

К-1 К А-1 А+ К-1 
и фи; и] -2и;  +и; . 
1 1 =а2 1-1 1 К ен (20.23) 
т и2 
(т.е. увеличим в нем на единицу верхний индекс) и сравним ре- 
зультат с сеточным уравнением (20.12). Видим, что в левых час- 
тях (20.12) и (20.23) стоит одна и та же аппроксимация 


ди 
производной т пригодная для всего отрезка [1%, (;41| прямой 
1 


х=х; и имеющая наивысшую точность 0(=?) в средней точке 

(; +0.5т этого отрезка (см. $ 13.2). Дроби в правых частях этих 

уравнений представляют собой аппроксимации второй произ- 
2 


водной си одного типа, но на разных слоях: на слое К в 


уравнений (20.12) и на слое К-+1 в уравнении (20.23); иначе, рас- 
четными точками служат точки (х;;;)в первом и (х;; 141) во 
втором случаях. Есть некий смысл в том, чтобы в качестве рас- 
четной точки при построении новой схемы взять не узловую 
точку прямой х=х;, а какую-то промежуточную точку отрезка 
(к, | этой прямой. В зависимости от того, в каком отноше- 
нии эта условная расчетная точка будет делить указанный отре- 
0°и 

2 
подменять соответствующей линейной комбинацией ее аппрок- 
симаций на слоях К и К +1; ту же линейную комбинацию приме- 
няем к сеточной функции 2(х;, (+). Таким образом, приходим к 


зок, соединяющий А-йи (А -+П)-Й слои, производную будем 


* 

равенству ) 
К-+1 К 2 

и и а К А |1 

” аа —2и; чи )+ 


+ - о) — 2 чи + о +А-о)ЁН, (20.24) 


* 

) По логике предшествующих рассуждений относительно условной 
расчетной точки вместо двух последних слагаемых в нем лучше использо- 
вать значение ©(х;, 914 +(1-в)щ+1). 
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где оЕ[0,1] — вещественный параметр (вес); 1=12,й ‚п-1; 
К =0,1,й ;т-1. 

Ясно, что вновь построенная разностная схема (20.24), на- 
зываемая схемой с весами, обобщает схемы (20.12) и (20.23): при 
о =| — это явная схема (20.12), при о =0 — неявная схема 
(20.23) или, что то же, (20.13). Если 0<оа <1, то равенство 
(20.24) связывает шесть точек двух слоев, т.е. отвечает шаблону, 
изображенному на рис. 20.3. 


(-ЪА+1) (А+ (+ЪА+И 


(1—1, ^) (К) (1+1, ^) 


Рис. 20.3. Двухслойный шеститочечный шаблон 
для разностной схемы (20.24) 


Заметим, что явной схема (20.24) является только при зна- 
чении веса о =1; при всех остальных значениях ©’ Е[0,1) она — 
неявная. Чтобы отличить от всех неявных схем этого однопара- 
метрического семейства рассмотренную ранее неявную схему 
(20.13), соответствующую четырехточечному шаблону, ее зачас- 
тую называют чисто неявной схемой. Для неявных схем приме- 
няют также названия схемы с опережением [158] или схемы с 
упреждением [172]. 

Другим важным частным случаем семейства формул (20.24) 
является случай о = 0.5. При этом значении о’ с учетом обозна- 
чения постоянной У (20.17) из (20.24) имеем равенство 


и ай? вт — 2 чи }- 


2 
А+ +1 А+ К-+1 
+2 на —2и; ы ил )+ мы +2: ) 
которому далее придаем типичный вид трехточечного разност- 
ного уравнения второго порядка относительно неизвестных зна- 
чений на (А +1)-м слое: 
ри А+ А-1 К 
—(2+2)и; + =(:, (20.25) 
где 
К А К К К А+ 
вр = -2-2щ -шы- мг. (20.26) 
Полученная неявная двухслойная разностная схема (20.25)- 
(20.26) (в которой полагаем 1=1,2,й ‚п-1; =0,1,й ‚т-1)на- 
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зывается схемой Кранка-Николсон”). Практически очевидно, 
что она аппроксимирует уравнение (20.1) с точностью 
о? +:? ) а технология ее использования не отличается от опи- 
санной выше для чисто неявной схемы (20.19). Доказана абсо- 
лютная устойчивость этой схемы, что позволяет проводить 
расчеты по ней с произвольными шагами Й и т, обеспечиваю- 
щими достаточную точность аппроксимации. 

При любых других значениях о Е [0,1], д=0.5, погреш- 
ность аппроксимации схемы с весами (20.24), (называемой также 
обобщенной схемой Кранка-Николсон), составляет величину 
о? +1). Для сЕ [0, 0.5] схема абсолютно устойчива, если же 
се (0.5, |, то устойчивость имеет место при выборе шага по 

2 
времени, удовлетворяющего неравенству т и (дока- 
2а(25-1) 
зательство см., например, в [13]). Схема Кранка-Николсон выде- 
ляется из семейства (20.24) как самая предпочтительная [10]. 

Наряду с рассмотренными выше применяют и другие схемы 
аппроксимации уравнения теплопроводности (20.1) с менее про- 
зрачной логикой построения. Вот две из них [100]. 

1. Неявная пятиточечная трехслойная схема 

зы ТИМ" ош чи о вы. 
Вю; 3 (20.21) 
2 т р (а и2 


абсолютно устойчива, погрешность аппроксимации о? +12 } 


2. Схема Дюфорта и Франкела 


5! (20.28) 


—Щ_ явная четырехточечная трехслойная; сходится с порядком 


2 
(2 - г)+ <; при условии, что т > 0, й> 0, 5-0. 
12 й 


* 
) Авторы статьи [202], в квар впервые рассмотрена данная схе- 
ма, английские математик Лопп Сгапк (род. 1916) и физик РВуШ$ №с0150п 
(1917—1968). Учитывая, что второй из авторов этой публикации — жен- 
щина, обращаем внимание на бытующее в отечественной литературе 
грамматически неправильное написание «схема Кранка-Николсона». 
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Шаблоны этих схем изображены на рис. 20.4, а и б соответ- 
ственно. 


(-Ьк+1) (4+0 (+,+1) (1+1) 
(к) 
@-ьЮ) @+ЬЮ) 
(1к-1) (5-1) 
а) 6) 


Рис. 20.4. Шаблоны разностных схем (20.27) и (20.28) 


20.4. ДИСКРЕТИЗАЦИЯ ВОЛНОВОГО УРАВНЕНИЯ 


Рассмотрим применение метода конечных разностей к зада- 
че о свободных колебаниях струны: 


2 я. 
— = а2 — (20.29) 

Ге Ох 
и(х, 0) = Ф(х) прихЕ[о,П, (20.30) 
ги =1(х) при хе [0, 1, (20.31) 
и(0,6)=0, и(,0=0 пригЕ[О,Т]. (20.32) 


О смысле каждого из равенств (20.29)—(20.32)) говорилось в 
$ 19.2. Ясно, что начальное условие (20.30) и граничные условия 
(20.32) должны быть согласованы в точках (0; 0) и (1; 0). 

Данная задача определена в той же прямоугольной области 
О -= (0, 1) х(0,Т) с границей Г, что и задача теплопроводности 
(20.1)—(20.3), и для построения разностных схем здесь естествен- 


но использовать те же сетки ©} внутренних узлов (х;; 1) и ©; 


всех узлов области ОФ = О Г, где х;, ; задаются равенствами 


(20.4), (20.5). Так же естественно аппроксимировать ги по 
формуле вида (20.7), посредством которой аппроксимируегся 
27, т.е. по формуле 
[бр ь | В | | 

д?и|  _ихь и -2ихь Ц) ихь Ц) +0?) 


х=х, 
01? [1= г? 
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В таком случае, имея в виду прежнее обозначение (20.11) 
К. 
иг м и(х,, 1), 
приходим к разностной схеме 


ии чи! _ оиу 2 + 


г? р? 
аппроксимирующей волновое уравнение (20.29) на шаблоне типа 
«крест» (рис. 20.2в) с точностью О 1? +г* ). Обозначив 


) 


2 
Я =а? т, (20.33) 
и2 
эту схему преобразуем к простой явной формуле 
и +27) +, (20.34) 
где полагаем 1=1,2,й ‚п-1; К=1,2,й ‚т-1. 


Чтобы однозначно осуществить процесс вычислений по 
формуле (20.34) при фиксированных и и т (или Й и т), т.е. по- 


лучить таблицу значений и; — приближенный каркас решения 
и(х;, +) данной задачи на сетке О}, нужно дополнить эту фор- 
мулу значениями на нулевом слое 
0 0 0 0 
и = 0, и] =Фр,й ‚› ИЛ = Фил, Ия =0 (20.35) 
и значениями 
и =0, и =0 (К=Ь2,Й т) (20.36) 


на границе (что соответствует заданным условиям (20.30) и 
(20.32)), а также воспользоваться какой-нибудь аппроксимацией 
производной в условии (20.31) для подсчета значений и; на пер- 
вом слое. Самое простое — применить здесь простейшую не- 
симметричную аппроксимацию 


ди(х;, 0) Е и(х, п) -и(х,, 0) 


+О(т); 
[6/1 Ф (2) 
тогда, согласно (20.31), имеем 
Г и0 
Ни, > ши, (20.37) 


и далее можно вести счет по формуле (20.34), привлекая по ходу 
вычислений равенства (20.35), (20.36). Но при таком способе 
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подсчета значений на первом слое точность аппроксимации дан- 
ной задачи разностной схемой (20.34)-—(20.37) в целом будет 
лишь Ой? +т ‚ поскольку «на старте» качество аппроксимации 
оказывается более низким. 

Вместо (20.37) можно получить формулу второго порядка 
точности. Выведем ее методом фиктивной точки, суть кото- 
рого — в следующем. 

При каждом 1=12,й ‚и-| будем использовать точку 


(х;; 1) = (х;; — Г), лежащую за пределами сеточной области Ор, 
и привлекать какие-либо два соотношения, опирающиеся на дан- 


ные в задаче условия и связывающие значение иг эжи(х, Е) 


искомой функции в этой «фиктивной точке» со значениями и? И 


и! на нулевом и первом слоях; исключение этого фиктивного 


значения и: приводит к дополнительному уравнению относи- 


тельно значений и? и и1. 


В данном случае это можно реализовать так. 
Пользуясь тем, что по формуле симметричной аппроксима- 
ЦИИ 


о 2т 
в силу условия (20.31) можно записать равенство 


и! т 


2т 


ди би, 0.2) 


=, 
откуда 
и =и! - 2. (20.38) 


Второе из требуемых соотношений получаем из основного ра- 
венства (20.34), полагая в нем К=0 и учитывая сеточные на- 
чальные данные (20.35). Имеем: 


и ем +74 + (2-27)? +7иы 5 


Г - и! +71 +(2-27)Ф; + УФ. (20.39) 


и 
Приравнивая правые части в выражениях фиктивного значения 
иг! по формулам (20.38) и (20.39), приходим к явной формуле 
второго порядка точности для вычисления недостающих для 
применения схемы (20.34) значений на первом слое: 
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и} = ти; + 1-7); +0.57(Ф;1 +94). (20.40) 


Последнее равенство можно получить и другим путем, на- 
пример, разлагая функцию и(х;, Г) в точке (х;; 0) по степеням { 
0?и(х,, 0) 
и используя разностную аппроксимацию ———— вместо 
Ох 
д?и(х,, 0) 


01? 

Доказано [78, 100, 103, 138, 158] (как правило, это делается 

методом разделения переменных для разностной задачи), что 
условие 


ввиду их исходной связи (20.29) [158]. 


Я <1, т.е. т<=, (20.41) 


© |= 


обеспечивает устойчивость построенной явной трехслойной 


разностной схемы”). Как видим, здесь опять фигурирует ограни- 
чение на величину шага по времени, но уже не такое жесткое, 
как в случае явных схем для параболических уравнений (шаг по 
времени может быть того же порядка, что и шаг по пространст- 
венной переменной). Таким образом, при условии (20.41) имеет 
место сходимость 


№ и 0 при й-0, г->0 


решений сеточных уравнений (20.34) (с У из (20.33)) с дополни- 
тельными равенствами (20.35), (20.36); если при этом использу- 
ется равенство (20.37), то погрешность в приближенного 


решения составляет величину О 12 +т ‚ если (20.40) — 
о? +12 ) 

Безусловно устойчивые разностные схемы для гиперболи- 
ческих уравнений существуют, но все они являются неявными. 


Здесь у них нет больших преимуществ перед явными, и они при- 
меняются крайне редко [138]. 


* 
) Условие ат<й называют условием Куранта. В случае ат=й 
отмечается «слабая неустойчивость счета» по явной формуле (20.34) [78]. 
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20.5. О КОНСЕРВАТИВНЫХ СХЕМАХ И 
О РАЗРЫВНЫХ РЕШЕНИЯХ 


Рассмотренные выше построения разностных схем для двух 
наиболее простых и хорошо изученных двумерных нестационар- 
ных задач математической физики на основе формальной замены 
производных разностными отношениями могут служить лишь 
некоторым образцом, отправной точкой при приближенном ре- 
шении конечноразностным методом тех или иных конкретных 
содержательных задач. Более полное представление о пробле- 
мах, возникающих на этом пути, и о способах их разрешения 
можно получить, изучая более подробную в этой части учебную 
и специальную научную литературу (см., например, [9, 14, 20, 
27, 78, 102, 113, 143, 156, 159, 160]). Здесь мы попытаемся толь- 
ко вкратце ознакомиться с понятием консервативной схемы и с 
одним из источников появления разрывных решений, что жела- 
тельно иметь в виду при конструировании разностных схем для 
нестационарных задач. 

1. О консервативных схемах [92, 152, 178]. Если требую- 
щее решения дифференциальное уравнение с частными произ- 
водными является не абсолютной абстракцией, а служит 
математической моделью некоторого физического явления, то, 
надо понимать, оно может иметь обычную форму записи относи- 
тельно искомой функции (плотности, скорости, давления, темпе- 
ратуры и т.п.), а может быть записано в так называемом 
дивергентном виде, где искомым параметром выступает масса, 
импульс, энергия, .... Дивергентная запись уравнения отражает в 
дифференциальной форме соответствующий локальный (т.е. в 
текущей точке пространства в текущий момент времени) физи- 
ческий закон сохранения величин и может быть выведена из гло- 
бального (т.е. в некоторой конечной области пространства в 
некоторый конечный промежуток времени) закона сохранения, 
имеющего интегральную форму записи. Учитывая более общий 
характер глобальных законов сохранения, целесообразно конст- 
руировать разностные схемы для УМФ так, чтобы они в ячейках 
сетки удовлетворяли соответствующим интегральным соотно- 
шениям и при суммировании по всем ячейкам давали закон со- 
хранения по всей области в целом. Такие разностные схемы 
называют консервативными (или, реже, дивергентными). По- 
строение консервативных схем более сложно и требует примене- 
ния специальных приемов. Одним из них является интегро- 
интерполяционный метод (метод баланса), основанный на 
записи интегральных уравнений, отражающих закон сохранения 
для элементарных ячеек, и применении к интегралам простей- 
ших квадратурных формул [158, 159] (нечто подобное мы уже 
делали ранее в гл. 14, 15 при построении численных процессов 
решения обыкновенных дифференциальных уравнений, правда, 
сугубо на формальной основе). 


744 


Консервативные разностные схемы более точно передают 
свойства искомого решения, заложенные в соответствующих за- 
конах сохранения, чем неконсервативные схемы. Особо это важ- 
но в случае, когда искомое решение может быть разрывным, что 
естественно допускается интегральной формулировкой закона и 
лишь формально описывается дифференциальным уравнением. В 
такой ситуации аппроксимирующая уравнение устойчивая не- 
консервативная схема, имеющая при фиксированных шагах 
единственное решение, может приводить в пределе к функциям, 
не имеющим ничего общего с искомым обобщенным решением 
(есть сходимость, но не к тому), в то время как на сходимость к 
этому разрывному решению консервативной схемы, удовлетво- 
ряющей условиям аппроксимации и устойчивости, можно рас- 
считывать наверняка. Для линейных УМФ с постоянными 
коэффициентами и гладкими решениями консервативность схем, 
получаемых конечноразностной аппроксимацией производных, 
обычно имеет место. 

Кроме консервативности, имеется несколько других 
свойств разностных схем, которые связывают с соответствую- 
щими свойствами решений и которые полезно учитывать в кон- 
кретных задачах: монотонность, положительность и т.п. 


2. О характеристиках и разрывных решениях. Затрону- 
тая выше проблема нахождения разрывных решений особо акту- 
альна и показательна для квазилинейных уравнений переноса 
(т.е. уравнений вида (19.12), где под с понимается не постоян- 
ная, а некоторая функция, зависящая от искомой переменной и), 
а также для уравнений и систем гиперболического типа. 

Сначала рассмотрим на полуплоскости 


—®<х<о, [>20 


линейное однородное уравнение переноса 


ди, ‚ди _ 
ис =0 (20.42) 
с начальным условием 
и(х, 0) = (>). (20.43) 


В данной полуплоскости выделим те линии х=х(Г), которые 
удовлетворяют обыкновенному дифференциальному уравнению 


Очевидно, этому уравнению удовлетворяют всевозможные пря- 
мые 


ИЕ, (20.44) 


где ДЕ (—0, +) — произвольная постоянная. Прямые (20.44) 
называются характеристиками уравнения (20.42). Придавая 
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параметру 4 различные вещественные значения, можно полу- 
чать сколь угодно густую сеть параллельных прямых: наклонен- 
ных под острым углом по отношению к положительному 
направлению оси Ох, если с > 0, и под тупым, если с < 0 (рис. 


. [1 № 
„ МА. 


а) с>0 6) с<0 
Рис. 20.5. Характеристики линейного уравнения переноса (20.42) 


40 


Предположим, что функция и(х,Г), служащая решением 
уравнения (20.42), рассматривается на характеристике (20.44). 
Тогда, в силу связи х = х(Г), она будет функцией только одной 
переменной 1: 


и(х, г) = и(х(!), В = (В. 


Ее дифференцирование по { с привлечением формулы полной 
производной дает 


аи _ ди, ди ах _ ди, ди 
—= + ы 
би м в 

что с учетом удовлетворения уравнению (20.42) означает 


Чи _ 0 — 1(0)=соия. 

Ге 
Таким образом, приходим к выводу, что решение уравнения 
(20.42) на его характеристиках сохраняет постоянные значения. 
Другими словами, начальные значения, задаваемые условием 
(20.43) в момент времени /=0, при увеличении { переносятся 
вдоль характеристик, и если начальная функция ф(х) разрывна, 
то, значит, и решение и(х, г) будет иметь разрыв вдоль характе- 
ристик, проходящих через точки разрыва ф(х), что должно учи- 
О при построении разностных схем для задачи (20.42)- 


Замечание 20.1. Проведенные выше рассуждения показывают, что 


при постановке начально-граничной задачи для уравнения переноса 
(20.42) (или более общего (19.12)) в прямоугольнике [0, /] х[0, 7] краевое 
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условие на функцию и(х,г) достаточно задавать только на одной стороне 
прямоугольника: при х = 0, если с > 0, ипри х =/, если с<0. 


Для квазилинейного уравнения переноса 


ди . „ди — () (20.45) 


характеристики задаются с помощью ОДУ 4 =и, и при каждом 


фиксированном значении и представляют собой семейства пря- 
мых 


х=ш+а (20.46) 


с параметром семейства 4. Эти характеристики обладают тем же 
свойством, что и прямые (20.44), передавать неизменным значе- 
ние решения от меньших значений временной переменной к 
большим значениям. Придавая параметру 4 те или иные вещест- 
венные значения, будем иметь при заданном начальном условии 
(20.43) конкретные значения 


и = (а, 0) = Ф(4) 


и тем самым фиксировать конкретные прямые из семейства 
(20.46). Поскольку их угловые коэффициенты и = 9(4) изменя- 
ются с изменением 4, квазилинейное уравнение (20.45) имеет 
уже не параллельные характеристические прямые, как в случае 
линейного уравнения (20.42), а веерообразные, расходящиеся с 
ростом [, если начальная функция 9(х) — возрастающая, и 
сближающиеся с ростом [, если Ф(х) — убывающая (рис. 20.6). 


1. 


а) 6) 
Рис. 20.6. Характеристики квазилинейного уравнения переноса (20.45): 
а) случай возрастающей $(х) в (20.43); 
6) случай убывающей ф(х) 


1 
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Если ситуация, когда функция Ф(х) возрастает, малоприме- 
чательна, то при убывании ф(х) неизбежно появление разрыв- 
ных решений (хотя ф(х) непрерывна). Действительно, как видно 
из рис. 20.66, любые две характеристики уравнения (20.45) обя- 
зательно пересекутся, и в точку пересечения эти характеристики 
перенесут с оси Ох каждая свое значение решения. Возникаю- 
щее противоречие в том, что считать решением данной задачи на 
линиях, образованных точками пересечения характеристик (ли- 
ниях разрыва), требует, во-первых, доопределения самого поня- 
тия решения в таких точках (здесь обычно привлекаются 
интегральные законы сохранения), а во-вторых, учета наличия 
разрывных решений при конструировании разностных схем. 
Один из способов такого учета при составлении разностных 
уравнений, например, для систем уравнений с частными произ- 
водными гиперболического типа, имеющих два семейства харак- 
теристик, связан с построением специальных сеток, узлами 
которых служат точки пересечения характеристик (в общем слу- 
чае криволинейных) или согласованные с ними определенным 
образом точки. Первичные сведения об этом методе, называемом 
методом характеристик, можно найти в учебных пособиях 
[152, 178], подробное изложение и библиографию — в моногра- 


фии [113]. 


20.6. РАЗНОСТНЫЕ СХЕМЫ ДЛЯ ПАРАБОЛИЧЕСКОГО 
УРАВНЕНИЯ С ДВУМЯ ПРОСТРАНСТВЕННЫМИ 
ПЕРЕМЕННЫМИ 


Посмотрим, что означает для метода конечных разностей 
повышение на единицу размерности решаемой параболической 
задачи по сравнению с изучавшейся в $ 20.1 аналогичной задачей 
с одной пространственной переменной. Сделаем это на примере 
задачи теплопроводности для изотропной квадратной пластин- 
ки О:= [0, 1] х[ 0,1] (границу которой будем обозначать Го) в 
координатной плоскости Оху для промежутка времени [Е [0,7]. 


Примем за данность, что процесс теплопередачи описывается 
уравнением 


я 2 
ди — д?| 0и 0, (у 1), (20.47) 
0 дх? ду? 


* 
) Неизотропный случай описан, например, в [92]. 
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определенным в параллелепипеде Ох[0,Т] (рис. 20.7), началь- 
ным распределением температуры 


и(х, у, 0) = ф(х, у) при (%у)еО (20.48) 


и значениями температуры на границе пластинки в любой мо- 
мент времени [Е [0, 7] 


и(х, У, 1) = у(х, У, 1) при (х; У) Е Го. (20.49) 

Чтобы применить метод конечных разностей к поставлен- 

ной смешанной задаче для уравнения теплопроводности, задан- 
ную пространственно-временную область ОФх[0,Т] покрываем 


сеткой о), ‚ состоящей из узлов (х;; у в) — точек параллеле- 
пипеда”), лежащих на пересечении трех плоскостей: 
х=х, где х=Ш, 1=0,1й,п, Йй= 
У=У,, ге у,=Л№, ]=0,ЬЙ,п, Й 
=, где #=Ат, Ё=01й,т, т= 


Узлы, соответствующие значениям индексов 7, /, равным 0 или 
п, и значению К = 0, считаются граничными; остальные узлы — 
внутренние. Узлы (х;; у;; 1), отвечающие одному фиксиро- 
ванному значению К, т.е. лежащие в фиксированной плоскости 
1 = (+, называются слоем. 

Аналогично обозначениям $ 20.1 вводим следующие обо- 
значения получающихся здесь сеточных функций: 

К. Й 

из = и(х;, Уф), Л =Л@ь у), 


К 
Ф; = Ф(хь У,), и =ись ур»). 


В соответствии с ними произведем сначала дискретизацию 
начального (20.48) и граничного (20.49) условий рассматривае- 
мой задачи. Имеем: 


во всех узлах нулевого слоя 
и =9(х,у,)=9у (1, 7=0,1,Й ‚п); (20.50) 


* 
в целях упрощения записей шаги сетки по пространственным 
переменным х и у взяты одинаковыми: Й =1› =йЙ. Для разных шагов 


см. упр. 20.7. 
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в граничных узлах произвольного К-го слоя 
К К 
и; = = (0, У) = и» и = У, 1) = Ук, 
(1=0,Ъй ‚м); (20.51) 


ий = т. ИСХ 0, 1) = и, и =(х,, 1, =, 
@=О,Ьй п). (20.52) 


Дискретизацию уравнения (20.47) на сетке о, будем про- 


изводить с помощью шеститочечного шаблона, изображенного 
на рис. 20.8. 


1 

| | 

0 1 

Рис. 20.7. Область задания Рис. 20.8. Явный двухслойный шаблон для 


уравнения (20.47) параболического уравнения с двумя про- 
странственными переменными 


рез 
— 
> 


и 


Принимая точку (х;; у;; 1) за расчетный узел (внутренний 
по отношению к сторонам пластинки О при 1, 1 =0,#и), ап- 
проксимируем в ней сначала оператор Лапласа 

Ди = 0*и + би 
> ® 
в? * бу 
входящий в уравнение (20.47), на шаблоне типа «крест», служа- 
щем составной частью («основанием») рассматриваемого про- 
странственного шаблона. Применив здесь формулу симметрич- 
ной аппроксимации второй производной для той и другой 
пространственных переменных, получаем 
К 
И; . 
НЬ/] 
Ди 5 = 


в у, и2 И2 
1=% 


К К К К А 
—2и; ИН, | ры. 7—1 —2и; Ир |1 


+0(й^), (20.53) 
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т.е. в расчетном узле с точностью 0?) значение выражения 


д?и _д?и 
а приближенно можно заменить значением 
2 2 
0х ду 
| ИИ К К [4 К 
Ари = и т. +41, 7 и; 1 чи; у —4и; ) (20.54) 


12 
Далее, через значения функции и в узлах А-гои (К+1)-го слоев 
в соответствии с шаблоном можно записать 


К-1 | 
ди 9 в 
| хех, = + О(Ф), (20.55) 
01 | у=У,; у 
19 
т.е. с погрешностью О(т) заменить в данном уравнении значение 
2% в расчетном узле значением 
Ги А+ | 


Таким образом, используя аппроксимации (20.53) и (20.55), 
т.е. подставляя в уравнение выражения (20.54) и (20.56), прихо- 
дим к равенству 


АН 2 т [К Г: |: Г: А Г: 

и и +а у ЧИ, } чи; 7—1 чи, Н -4и*)+ 9 › (20.57) 
представляющему собой явную формулу для вычисления при- 
ближенных значений неизвестной функции и(х, у,[) в узловых 
точках (К+1)-го слоя по известным ее значениям на К-м слое. 


При этом, естественно, чтобы процесс вычислений мог быть на- 
чат и продолжен, привлекаются дополнительные условия 
(20.50)—(20.52) в граничных узлах. 

Очевидно, что построенная явная разностная схема при 
достаточной гладкости решения аппроксимирует данную задачу 


с точностью О(й? +). Ее устойчивость доказана при условии 


служащем существенным ограничением на шаг по времени, что 
приводит к большим вычислительным затратам при расчетах на 
сколько-нибудь протяженных временных промежутках 7. 

Для построения безусловно устойчивой схемы — аналога 
неявной схемы (20.19) — используем шаблон, симметричный 
изображенному на рис. 20.8 (вместо узла, помеченного как 
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(+1 
ы7 


плоскости АК-го слоя узел 


} (К+П-го слоя берется симметричный ему относительно 
к-1 
ь] 
аппроксимации оператора Лапласа Ди в расчетной точке 


| (К -Г)-го слоя). При той же 


(хрул 1) выражением Арии по формуле (20.54) и подобной 


(20.56) аппроксимации производной г. выражением 
| ( А #4] 
— И .. — И .. 
\й Я 


с такой же, как и в (20.57), погрешностью аппроксимации 
ОИ? +т получаем неявную разностную схему 


| фо 2т А А А А А К 
иу-иу =а у ину НИ у +, 1 -4и! + бу, 


которой с учетом обозначения 


у=а?-Р, (20.58) 
и2 


придаем вид 
Па, у + И, } +8, 1+7 а - +47)иу =-иу' - у. (20.59) 


При каждом фиксированном А =1,2,й , т разностное урав- 
нение (20.59) представляет собой СЛАУ относительно неизвест- 
ных значений сеточной функции и, принадлежащих А-му слою. 
Такая система при том или ином естественном упорядочивании 
неизвестных (сначала по 7, потом по ], или наоборот) имеет пя- 
тидиагональную структуру (с «разнесенными» диагоналями) 
матрицы коэффициентов с очевидным диагональным преоблада- 
нием и в совокупности с дополнительными условиями (20.50)- 
(20.52) однозначно разрешима при любых значениях у. Однако, 
прямое ее решение нельзя выполнить столь эффективно, как это 
делается в случае неявной схемы (20.19) для параболического 
уравнения с одной пространственной переменной, т.е. несмотря 
на наличие специальных методов решения сеточных уравнений 
(см. например, [161], добавление еще одной пространственной 
переменной принципиально увеличивает объем вычислений. 

Встает вопрос о построении экономичных схем. Так назы- 
вают аппроксимирующие задачу разностные схемы, безусловно 
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устойчивые и требующие при переходе от одного временного 
слоя к другому арифметических действий в количестве, имею- 
щем один порядок с количеством узлов на слое [14]. Очевидно, 
неявные схемы с весами (20.24), в том числе чисто неявная схема 
(20.19) и схема Кранка-Николсон (20.25)—(20.26), построенные 
ранее для задачи теплопроводности с одной пространственной 
переменной, свойством экономичности обладают, чего нельзя 
сказать о схемах (20.57) и (20.59). 

Для построения экономичной схемы решения задачи 
(20.47)—(20.49) используем следующий подход. 

Между АК-ми (А+1)-м слоями введем промежуточный слой 


В . —: т 
расчетных точек У), где Ин = +5. Для подсчета 


значений 


я $ $ 
и, тя и У, ин] 


во внутренних узлах промежуточного слоя в данном уравнении 
(20.47) аппроксимируем производные по формулам 


1 
МИ 
би. 
91 2 °’ 
5 #5 е 
22 ЧР) 2} 
та ) 
дх? р? 
Г: Г 
22 Шу 2% чи, „1 
ду? р2 
В результате получаем сеточное уравнение 
+1 2 + + + 
а в. 2. 2 2 К 
к ль МИ 1. 2иу Чин +, }-1 
| т и 
—2и; ЧИ, /+1 +5.) , 
+1 


где Л, 2 := Л», 1). Привлекая обозначение (20.58), 
2 
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этому уравнению придаем стандартный вид трехточечного урав- 
нения второго порядка 
1 1 1 


1 
&+— Е+-— К+-— + 
2 2 2 р. Й 2 р: 
1, 1 [2 > и Г 1 ыы 1—1 


+ (2-2 (20.60) 


связывающего неизвестные значения в трех соседних по направ- 
лению оси Ох узловых точках промежуточного слоя. 

Так как правую часть равенства (20.60) при переходе от К- 
го к (К+1!)-му слою можно считать известной, то при каждом 
фиксированном /=1,2,Й ‚п-1 оно представляет собой систему 
из п-1 уравнений с п-+1 неизвестными, два из которых факти- 
чески известны из граничных условий (20.51). Матрицы коэффи- 
циентов всех таких и-1 СЛАУ, соответствующих различным 
значениям /, одинаковые трехдиагональные с явным диагональ- 
ным преобладанием при любом значении у. Соответственно, 
каждая из них может быть решена методом прогонки за О(и) 
число арифметических операций (см. $ 2.6), т.е. для нахождения 


(п = значений неизвестных на промежуточном слое количест- 
во о арифметических операций составит величину 
2 


О 
Переход от (, «То слоя к (К +1)-му совершается на осно- 
ве аппроксимации производных по формулам 


1 
ик И 
и 
0: т/2 у 
+ еы + 
д2и о и —2и; Ти, } 
ыы й 
дх? 12 
К+1 К+1 К+1 
92 Шут 2% чи, +1 
ду? р? 


подстановка которых в исходное уравнение (условно для той же 
расчетной точки (х;; уу; а )) приводит к аналогичному (20.60) 
2 
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уравнению 


+1 2] +1 +! ва. 9 
ше 1—1 - [224 ы Ь 7+1 у И И ы 
2 и + 
+ (2-2 и +1. (20.61) 
Фиксируя здесь 1=1,2,Й ‚п-1, будем получать линейные сис- 


темы относительно неизвестных узловых значений вдоль на- 
правления оси Оу, причем матрицы этих систем — те же, что и в 
предыдущем случае, следовательно, привлекая граничные значе- 
ния (20.52), методом прогонки все искомые значения на (К+1)-м 


слое могут быть подсчитаны за о? арифметических операций. 

Итак, совокупность формул (20.60), (20.61) и дополнитель- 
ных к ним начальных и граничных условий (20.50)—(20.52) опре- 
деляет экономичную неявную разностную схему, которая, как 
доказано [78, 92], является абсолютно устойчивой и аппрокси- 
мирует исходную задачу (20.47)-—(20.49) со вторым порядком по 
каждой из переменных х, у,!. Метод решения параболических 
задач с двумя пространственными переменными, основанный на 
построении подобных схем (называемых — продольно- 
поперечными схемами), носит названия метод переменных на- 
правлений, метод продольно-поперечных прогонок, метод 


Писмэна-Рэчфорда [204]. Это один из лучших методов реше- 
ния таких задач [78], однако, он не имеет непосредственного 
обобщения на случай трех пространственных переменных в па- 
раболическом уравнении. 

Более продуктивными в плане обобщений являются мето- 
ды расщепления. В наиболее абстрактной постановке речь идет 
о расщеплении операторов [13, 14, 118], в менее абстрактной — 
можно говорить о расщеплении по физическим процессам и по 
координатам. 

Рассмотрим вкратце один из вариантов метода покоорди- 
натного расщепления, который также можно назвать методом 
дробных шагов (впрочем, как и метод переменных направлений). 

Представив функцию Г в виде Д+ >, данное уравнение 
(20.47) заменяем двумя: 


—+ ; ЖЕ 
Е РЕ ЛС, у, 0 


* 
)в разных переводах можно встретить написание Рэчфорд, Реч- 
форд, Рекфорд, Рэкфоро. 
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19 29° — + 2 ( у,0, 
ду? 


в сумме дающими (20.47). Эти два уравнения аппроксимируем 
соответственно сеточными уравнениями 


1 Е] 1 ‚1 
+ + + А+ 
2 К 2 —9 2 я) 
и:: —и;: и; . и;; +и, 
1, 1 |В 
И И а? 1 Л у НН / ев ы (20.62) 
и 
А-1 9 А+ А+ К-1 
и фи, ил -2и ЧИ, |1 
И И = 22 ь /- ь + + (№ у (20.63) 
т и2 


в которых узнаём чисто неявные схемы для одномерного уравне- 
ния теплопроводности. Решая прогонкой разностное уравнение 
(20.62) (СЛАУ с трехдиагональной матрицей коэффициентов при 

+ 
каждом фиксированном /), находим значения и, 2 
точном слое, затем из (20.63) последовательным фиксированием 


на промежу- 


` аналогично находим все значения и неизвестных на 


(К+П-м слое, что требует всего 0(?) арифметических операций 
и означает экономичность совокупной разностной схемы 
(20.62)-—(20.63). 

Особенностью такого локально-одномерного метода явля- 
ется то обстоятельство, что ни одно из разностных уравнений 
(20.62), (20.63) по отдельности не аппроксимирует исходное 
уравнение (20.47), но в ны, они обеспечивают эту ап- 


проксимацию с точностью О р? +т), в связи с чем такой метод 


относят к методам суммарной аппроксимации. Метод абсо- 
лютно устойчив. 


УПРАЖНЕНИЯ 


20.1. А) Получите таблицу, реализующую =-схему (см. $ 20.2) 
разностного уравнения (20.20) при у =0.5, © =0 на трех слоях. Убедитесь 


в том, что значение ты содержит ошибку —24= при одиночной ошибке 


значения и^ величиной = [20]. 
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Б) Проведите на нескольких слоях =-анализ разностной схемы 
(20.20) с &; =0 и произвольными у>0. Существуют ли значения у, при 


которых можно рассчитывать на устойчивость схемы? 
20.2. Проведя =-анализ явной двухслойной схемы (20.18) при 
2; =0, ответьте, противоречит ли его результат условию устойчивости 


(20.22)? 


20.3. Выведите формулу (20.40), привлекая разложение и(х,, 1) по 


д?и(х,,0 
формуле Тейлора в точке (х;;0) и заменяя В. выражением 
[6] 
з2 О?и(х,, 0) 
дх? 


20.4. Запишите явную трехслойную разностную схему, аппрокси- 
мирующую с точностью ОКЕ? + г?) уравнение вынужденных ко- 


лебаний однородной струны, начальные и краевые условия для которого 
задаются формулами (20.30)—(20.32). 


20.5. Пользуясь шаблоном, (-ЪА+1) (5+0 (+1А+1) 
изображенным на рис. 20.9, по- 
стройте неявную схему, аппрок- 
симирующую — гиперболическую Ю 
задачу (20.29)—(20.32) с точностью 
о? +:2) [178]. Запишите алго- 
ритм, реализующий получение Ш 
каркаса приближенного решенияс (1-ЪА-1) (А-П (@+ЬК-1) 
помощью этой схемы. 


т 


Рис. 20.9 


20.6. Составьте явную разностную схему, соответствующую шаб- 
лону рис. 20.10а и аппроксимирующую задачу 


ди ди _ Н 

+ =16 при (х;1) = [0, 1 х[о, ТТ, 
и(х, 0) = (х) при хе[0,П, 

и(0,1)=у(0 при 1=Е[0,Т] 


(гдес>0, 0(0) =\(0)) с первым порядком точности по х и по . 
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Можно ли считать пригодной аналогичную схему, опирающуюся на 
шаблон рис. 20.106 ? Почему? 


(1+1) (1+1) 
74 т 
р й 
(1-1) (А) (К) (1+1, ^) 
а) 6) 
Рис. 20.10 


20.7. А) Запишите расчетные формулы явной двухслойной разно- 
стной схемы типа схемы (20.57) для случая, когда смешанная задача теп- 
лопроводности (20.47)-(20.49) ставится для прямоугольной пластинки 
О = [0, 1 ]х [0, /5] и шаги сетки по х и по у неодинаковые (й и >, соот- 
ветственно). 

Б) Для указанного в А случая запишите формулы продольно- 
поперечной схемы. 


20.8. Изобразите шаблон, соответствующий неявной двухслойной 
разностной схеме (20.59) для задачи (20.47)(20.49). Выполните линейное 
упорядочивание узлов первого слоя при шаге й = 0.25 и покажите струк- 
туру соответствующей этому слою матрицы СЛАУ: 

а) в случае однородного граничного условия (20.49) (и=0); 


6) в случае неоднородного граничного условия (и =0). 


20.9. Обобщите задачу теплопроводности (20.47)-(20.49) на случай 
трех пространственных переменных. 

А) Составьте для нее явную разностную схему (основой для которой 
должен служить аналог формулы (20.57)). 

Б) Запишите для нее расчетные формулы локально-одномерного ме- 
тода (типа формул (20.62)-(20.63)). 
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ГЛАВА 21 |МЕТОД КОНЕЧНЫХ 
РАЗНОСТЕИ ДЛЯ 
СТАЦИОНАРНЫХ ЗАДАЧ 


В области задания двумерного эллиптического уравнения 
вводится равномерная прямоугольная сетка, строятся разно- 
стные схемы второго порядка точности (на шаблоне типа 
«крест»), показываются приемы учета граничных условий пер- 
вого рода в случае произвольной области и способы аппроксима- 
ции нормальных производных в граничных условиях второго и 
третьего рода. Подчеркивается разреженность матриц полу- 
чающихся при этом систем сеточных уравнений и, в частности, 
их блочно-трехдиагональная структура в случае, когда исходная 
задача ставится в прямоугольнике. Обсуждаются особенности 
и целесообразность применения к таким специфичным систе- 
мам изучавшихся в главах 2, 3 прямых и итерационных методов 
решения СЛАУ (Гаусса, МПИ, Зейделя, ПВР) и указывается на 
наличие хорошо приспособленных для этого экономичных мето- 
дов, среди которых выделяется итерационный метод перемен- 
ных направлений, реализующий принцип установления. Рассмат- 
ря численный пример (с использованием методов Зейделя 
и р 


21.1. КОНЕЧНОРАЗНОСТНАЯ ДИСКРЕТИЗАЦИЯ 
КРАЕВЫХ ЗАДАЧ ДЛЯ ЭЛЛИПТИЧЕСКИХ 
УРАВНЕНИИ 


Специфичность применения метода конечных разностей к 
стационарным задачам проявляется, в основном, на двух этапах: 
при аппроксимации граничных условий и при решении полу- 
чающихся в итоге дискретных задач большой размерности. В 
этом параграфе будем рассматривать лишь формальное построе- 
ние разностных схем для различных постановок стационарных 
задач на основе замены производных «стандартными» разност- 
ными отношениями и учета граничных условий тем или иным 
способом. 


Обратимся сначала к наиболее простой стационарной зада- 
че. А именно, построим разностную схему, отвечающую задаче 
Дирихле для уравнения Пуассона в области © с границей Г в 
случае, когда © — прямоугольник [а, 6] х[с, 4]: 


р 2 

Ли = ИО = (д, у) при (х;у)ЕО, (21.1) 
0х ду 
и(х, у) = ф(х, у) при (жу)ЕГ (21.2) 


(см. (19.5), (19.14). 
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Покроем данную двумерную область © сеткой узлов 
(хру,), образованных пересечениями прямых х=х; и У=У,, 
где 


х,=а+т, и =2=4, = ЦЙ м, 
(21.3) 


у; =с+ ЛЬ, йо = —\ 1=0,1,й ‚т 


(ти й> — шаги сетки по осям Ох и Оу соответственно). Будем 
называть узлы (х;; у;) внутренними, когда 1е {1,2,й ‚п-В, 
ЕП, 2,й ‚т-Ц, и граничными, когда 1=0 или 1=п, а 
Е, 2,й ‚т-Ц, и когда ]=0 или у =т, а {Е {1,2,й ‚п-П 
(см. рис. 21.1, где внутренние узлы помечены кружочками, а гра- 
ничные — крестиками ). Множество внутренних узлов сетки 
обозначаем Эл, в, › граничных узлов — Га, в, › всех узлов (внут- 


ренних и граничных) — Ол, в. Заметим, что узлы (хо; Уд), 


(х„; 0), (Х0; Ут), (Хи; Ут), соответствующие вершинам данно- 
го прямоугольника ©, при использовании шаблона типа «крест» 
(помечен на рисунке темными кружками) в расчетах не участву- 
ют и не относятся ни к внутренним, ни к граничным узлам. 


Рис. 21.1. Сетка и шаблон для дискретизации задачи (21.1)—(21.2) 
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Рассматривая данное уравнение (21.1) в расчетной точке 
(ху 7) Е Ой, „, и привлекая в соответствии с указанным пяти- 
точечным шаблоном «крест» формулы симметричной аппрокси- 
мации вторых производных для получения дискретной версии 
оператора Лапласа Ди (по аналогии с формулой (20.53) в $ 20.6), 
в предположении о достаточной гладкости решения и(х, у) (че- 
тырехкратной непрерывной дифференцируемости по х и по у) 
имеем 


и(х;_ ‚У ‚)—2и(х;, у; )+и(; ,У;) 
АИ 


2 
5 +0(3)= Г, ›,. 
п 
Отбрасывая здесь остаточные члены о? у О в) и используя 
обозначения 


П=Убьу,), и яищхь уу, (21.4) 
приходим к разностному уравнению 


| 1 = 
и, —2и; +и41, +, 1-2 +, ра) = Л, (21.5) 
И № 
(где 1=Ь2,й ,п-1; 1=2,йЙ ‚т-1), которыми подменяем 
данное уравнение на сетке ©) },. 

Формально в полученном таким образом разностном урав- 
нении (21.5) неизвестных столько, сколько всего узлов содер- 
жится в множестве ©) р, те. (и+1)х(т+1)-4. Однако часть 


из них (конкретно, 2т+2и-—4) сразу определяется точно из гра- 
ничного условия (21.2): 


0; =и(хо, У;) =Ф(0%, У;) =: 90» 


1=1,2,й ‚т 
Ил =и(хи, У)=ФСк, У;) =: Фи; (21.6) 


ид = и(х,, Уд) = Ф(хр, Уд) = Фю, 
И =и(х,, Ут) сы фФ(х;, Ин.) = т 


Следовательно, дополнив (21.5) совокупностью сеточных гра- 
ничных условий (21.6), получаем СЛАУ с квадратной матрицей 
коэффициентов относительно значений каркаса приближенного 
решения данной задачи Дирихле во внутренних узлах сетки. 
Построенная разностная схема (21.5)—(21.6) аппроксимиру- 
ет задачу (21.1)-(21.2) со вторым порядком точности и устойчива. 


1=1,2,й ‚п-1. 
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Последнее, как правило, доказывается с помощью разностного 
(сеточного) принципа максимума [14, 92, 100, 103, 153, 154, 155, 
158, 159]. 

Не вызывает затруднений формальная аппроксимация раз- 
ностной схемой со вторым порядком точности на той же сетке 


О), › с тем же шаблоном «крест» более общего уравнения 


д?и д?и ди ди 
ИС + +В ч6и=Р (21.7) 
дх ду дх ду 

(сравните с (19.13)), если оно задано в том же прямоугольнике 
О =[а, | х[ с, 4] с тем же граничным условием (21.2), когда ко- 
эффициенты д,С, р, Е, С и свободный член Ё уравнения зависят 
от переменных х и у, причем А и С в О удовлетворяют усло- 
вию эллиптичности АС > 0. 

Действительно, используя для вторых производных те же 
аппроксимации, что и выше, аппроксимируем первые производ- 
ные на том же шаблоне по симметричным формулам 


и, Мь 
К 
—*Я 
ди|  _Щхь у) Шар у, (2) 
о що ' №) 


Тогда, фиксируя в уравнении (21.7) точку (х; у) = т У;) и при- 


влекая обозначения (21.4) и им аналогичные, после отбрасыва- 
ния остаточных членов получаем соответствующее (21.7) сеточ- 
ное уравнение 


и; —2и; Чин, и, 1 2и, Ни, |+ ину И, ] 
и 2 Ао им р И] УИ 


И” | % М 
И И, 


Легко видеть, что уравнение (21.8) не имеет принципиаль- 
ных отличий от уравнения (21.5) в том плане, что также пред- 
ставляет собой пятиточечное разностное уравнение (связываю- 
щее пять значений в узлах «креста» — значения и; |, г, ;41, , Иу, 


и, рр И, 41) И при всевозможных значениях 7е {1,2,й ‚п-1, 
Е, 2,й ‚т-П — это СЛАУ с числом уравнений, совпадаю- 


щим с числом неизвестных, если дополнить ее сеточными гра- 
ничными условиями (21.6), и с аналогичной структурой матрицы 
коэффициентов. Поэтому далее ограничимся рассмотрением 
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простейшего эллиптического уравнения (21.1), варьируя лишь 
постановки краевых задач для него. 

Построение разностной схемы для эллиптического уравне- 
ния несколько усложняется, когда первая краевая задача для него 
ставится в области ©, отличной от прямоугольной. 

Пусть © в задаче (21.1)-(21.2) — произвольная конечная 
односвязная область с непрерывной границей Г, определяемой 
некоторым уравнением ц/(х, у) =0. Поместим эту область в пря- 


моугольник [хпи, Хтах |Х [Утт› Ушах | (Рис. 21.2), и на этот пря- 
моугольник наложим сетку (21.3), где принимаем 


а=Хиш, В=Хшах, СР Уши» Я: Ушах- 


ии Хтах 


х х 


Рис. 21.2. Прямоугольная сетка для непрямоугольной области 


Разбиение множества всех узлов, попадающих в область © 
или на ее границу, на внутренние и граничные здесь уже не столь 
однозначно, как это было в случае прямоугольной области. Име- 
ется несколько различных подходов к этому, и в каждом из них 
такое разбиение обычно связывают с выбранным для аппрокси- 
мации уравнения шаблоном. В случае «креста» наиболее простой 
подход — считать узлы (х;; у‚) внутренними, если они принад- 


лежат области © := ОГ вместе со своими четырьмя «соседя- 
ми» — вершинами «креста» с центром в точке (х;;у;}, и гра- 
ничными, если хотя бы один из этих «соседей» лежит за 
пределами © [92]. 

Примем за основу следующую, более естественную, на наш 
взгляд, классификацию узлов. 
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Узлы определяемой равенствами (21.3) сетки будем назы- 
вать внутренними, если они принадлежат данной открытой об- 
ласти © (множество их обозначаем ©, у), и граничными, если 
они попадают на границу Г области © (множество таких узлов 
Гр, ›). Узлы У РЕ О), р,, служащие центрами «крестов», 
целиком (т. е. вместе со всеми четырьмя вершинами) входящих 
во множество О) „ЭГ, ,, называем строго внутренними; 


всю их совокупность обозначаем о’ р. Узлы, служащие вер- 
2 


шинами «крестов» с центрами в строго внутренних узлах и не 
являющиеся при этом строго внутренними, называем пригра- 


ничными узлами; их множество г. й образует так называемую 
1; 72 


граничную полоску (см. рис. 21.2, где строго внутренние узлы 
обозначены кружками, а приграничные — треугольниками). 
Очевидно, что могут быть такие узлы, которые принадлежат © и 
при этом не относятся ни к строго внутренним, ни к пригранич- 
ным (на рис. 21.2 таких узлов три, найдите их!). 

Для задачи (21.1)-(21.2) в произвольной области © каждо- 


му строго внутреннему узлу (х;; у;) ставится в соответствие од- 


но сеточное уравнение вида (21.5). Множество таких уравнений 
нужно дополнить сеточными уравнениями относительно неиз- 
вестных значений приближенного решения в приграничных уз- 
лах, используя для этого каким-нибудь образом граничное усло- 
вие (21.2). Наиболее простой способ сделать это — осуществить 
простой снос, т.е. заменить значение и(х, у) в каждой точке 
граничной полоски значением данной функции ф(х, у) в бли- 
жайшей (по х, по у или по нормали к границе Г) точке границы Г. 
Однако, следует иметь в виду, что такой грубый учет граничных 
условий может значительно повлиять на качество аппроксима- 
ции задачи в целом. Несколько увеличить точность аппроксима- 
ции, не отказываясь от простого сноса, можно за счет расшире- 
ния множества используемых в расчетах узлов: в качестве 
приграничных узлов использовать «заграничные», находящиеся 
от границы на расстоянии, меньшем полушага 0.5Й или 0.5й> , а 
соответствующие приграничные внутренние узлы перевести в 
разряд строго внутренних. 

Альтернативой простому сносу при аппроксимации гранич- 
ных условий может служить предложенный немецким математи- 
ком Л. Коллатцем способ линейной интерполяции. Заключается 
он в следующем. 
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Пусть: Р — приграничный 


узел, М — ближайший к нему стро- о Г 

го внутренний узел, М — ближайшая М Р № 
к ним точка границы Г области ©; 

все три точки лежат на одной прямой й 4 


= . — А т г 
х=х; или у У; известны расстоя Рис. 21.3. К учету гра- 


ния [МР] =й, |РМ=4 (рис. 21.3). Ес- ничного условия способом 
тественно предположить, что значе- линейной интерполяции 
ние искомой функции и в точке Р 


приближенно линейно зависит от значений и(М) и и(М№) = Ф(М№), 
и его можно получить, разделив эти значения в отношении 


я =А, в котором точка Р делит отрезок ММ. Тогда по извест- 
Ч 


ной формуле деления отрезка в данном отношении можно при- 
НЯТЬ 


м и(М) + Ли( М) _ аш М) + йФ(М) 


м Я ЧР 


Если простой снос вносит погрешность аппроксимации 
О(й), то для способа линейной интерполяции погрешность ап- 


проксимации граничных условий составляет величину 0?) 
100]. 

Имеются и другие способы аппроксимации граничных ус- 
ловий в задачах Дирихле (см. [14] и др.). 

При решении методом конечных разностей второй крае- 
вой задачи для эллиптического уравнения, оставляя без измене- 
ний аппроксимацию самого дифференциального уравнения 


разностным на той же прямоугольной сетке он й строго внут- 
и, 


ренних узлов, при получении дополнительных связей в пригра- 
ничных узлах нужно аппроксимировать в них граничное условие 
вида (см. (19.15)) 


— = 9(>, у), (21.9) 


где п — направление внешней нормали к границе Г области ©. 
Сделать это можно, например, следующим образом. 

Рассмотрим получение дополнительного к основным разно- 
стного уравнения на основе заданного равенства (21.9) в пригра- 
ничном узле Р в ситуации, изображенной на рис. 21.4. 
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Выполнив ортогональное (или 
какое-либо другое) проектирование 
точки Р на границу Г, приходим к 
точке О, в которой, в силу условия 
(21.9), имеем 


` дв. у 
а исходя из близости точек Р и О, по- с 
лагаем Рис. 21.4. К получению 
разностного уравнения в 
ди(Р) =Ф(О) приграничном узле Р 
дп 


Считая, что нормаль п в рассматриваемой точке составляет угол 
@ с осью Ох, можно записать выражение производной по на- 
правлению нормали п(с0$@;зт@) через частные производные 
по координатам: 
ди(Р) ди(Р Эи<Р) . 
РР о АР а, 
дп ох ду 
Частные производные, в свою очередь, аппроксимируем про- 
стейшими разностными отношениями через значения неизвест- 
ных в соседних узлах М и №. Таким образом, для пригранично- 
го узла Р(х1; ук) имеем приближенное равенство 
и(ху, Ур) - исх и(х — и(х р). 
СО У) ЧО Уи УЕ В в 
Й п 
которое с учетом и;; := и(х;; у;) превращаем в разностное урав- 
нение 


соз@ 
р (ик —и 1-1, м 


ии —и, к) =Ф(О). (21.10) 


Для получения не схемы, аппроксимирующей, на- 
пример, задачу Неймана (21.1), (21.9) с точностью О(й), к ос- 
новным сеточным уравнениям вида (21.5) должно быть добавле- 
но столько ранен вида (21.10), сколько узлов содержится в 


граничной полоске г. вр. 
1, ил 


Как видим, в случае произвольной области ©» конечнораз- 
ностная аппроксимация второй краевой задачи является делом, 
гораздо более хлопотным, чем первой. 

Если какая-то часть границы Г параллельна координатной 
оси Ох или Оу, то в принадлежащих этой части границы точках 
производная по направлению нормали будет являться просто ча- 
стной производной по соответствующей переменной х или у. 
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В таком случае, получение «граничных» разностных уравнений 
типа уравнения (21.10) и сам их вид упрощаются (особенно, если 
параллельная оси часть границы включается в число прямых, с 
помощью которых образуется сетка). Точность аппроксимации 
при этом можно на порядок повысить, если в такой ситуации 
применить метод фиктивной точки, использовавшийся ранее 
($ 20.4) при аппроксимации дифференциального начального ус- 
ловия в задаче о свободных колебаниях струны. 

Пусть часть границы Г («правая») проходит по прямой 
х=Ь, включенной в семейство прямых х=х; при Г=и. Беря за 


расчетный узел граничную точку (х„; у;), дополняем этот узел, 
граничные узлы (х„; У; 1), (ху) и внутренний узел 
(Хиву) до «креста» фиктивным узлом (хит; у;), взятым за 
пределами © симметрично внутреннему узлу (х„1;у;) 


(рис. 21.5). На этом шаблоне проводим аппроксимацию заданно- 
го дифференциального уравнения; для задачи Неймана (21.1), 
(21.9) такой аппроксимацией служит сеточное уравнение 


ть, 1-я, 1) + 1-2; +ив, 1) = Лу. (21.41) 
1 2 


Условие (21.9) для этого случая 7 


можно записать в виде [Ф) 
(п, 7+1) 
ди 


й 
— в "2 
г" У=5, = #(„, у;) о 1 й, х р 
Ул (п-ЬлЛ й> (п+1, /) 
(п, —1) 


Г 


и аппроксимировать с точностью 


0?) разностным уравнением в 


и „= з Рис. 21.5. К методу фиктивной 
и-+1, ] п-ь] х = 
они > точки («правый вертикальный» 

21 участок границы Г) 


Выражая отсюда фиктивное значение и„.|,;, исключаем его из 
уравнения (21.11), в результате чего приходим к соответствую- 
щему взятой за основу граничной точке разностному уравнению 
второго порядка точности 


2 1 2 
т ии 7 пин) + 5 (ии, у —2и +Ии, +1) = Ли; НРУ. (21.12) 
1 2 


Построение разностных схем для третьей краевой зада- 
чи не привносит ничего нового по сравнению с методикой по- 
строения разностных схем для второй краевой задачи. 
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21.2. О СПЕЦИФИКЕ СЛАУ, АППРОКСИМИРУЮЩИХ 
ЭЛЛИПТИЧЕСКИЕ УРАВНЕНИЯ, 
И ПРЯМЫХ МЕТОДАХ ИХ РЕШЕНИЯ 


Как следует из предыдущего ен применение метода 
конечных разностей с пятиточечным шаблоном типа «крест» к 
краевым задачам для эллиптических уравнений сводит их к ре- 
шению систем алгебраических уравнений вида 


аи, ; +Брин1, ; + сии, 7-1 + Ари, |1 +ериу =Л (21.13) 


р) И у 

(сравните с (21.5), (21.8), где Ги / пробегают независимо мно- 
жества целочисленных значений от | до и-1 и до т-—1 соответ- 
ственно). В зависимости от заданных граничных условий урав- 
нения (21.13) дополняются теми или иными значениями 
неизвестных в граничных (или приграничных) узлах или вспомо- 
гательными уравнениями с участием этих неизвестных (см., на- 
пример, (21.6), (21.12)), что обеспечивает соответствие числа 
уравнений в итоговой алгебраической системе числу фигури- 
рующих в (21.13) неизвестных. При определенных требованиях к 
решаемой дифференциальной задаче, таких, как требование 


и(х, у)ЕС о), можно гарантировать, что заменяющая ее рас- 
смотренным способом дискретная (сеточная) задача при долж- 
ной аппроксимации граничных условий аппроксимирует данную 


задачу со вторым порядком точности”), однозначно разрешима, и 
имеет место сходимость (с тем же порядком) решений этой дис- 
кретной задачи к решению исходной задачи в процессе беско- 
нечного сгущения сетки по обоим направлениям одновременно, 
т.е. по х ипо у. 

Наличие сходимости означает, что чем меньше расчетный 
шаг А (будем для простоты считать, что используется сетка с 
квадратными ячейками, т.е. й =йЙ› =й), тем точнее сеточное 


решение м;} представляет точное решение и(х, у). Таким обра- 


зом, желание получить более точное сеточное приближение к ис- 
тинному решению исходной задачи порождает необходимость в 
уменьшении шага й. Однако такое уменьшение шага вызывает 
существенное увеличение количества уравнений в системе 
(21.13) (оно обратно пропорционально квадрату шага), что, в 
свою очередь, приводит к большому росту вычислительных за- 
трат на ее решение. 

Поскольку использование оценок погрешностей аппрокси- 


* 
) Существуют схемы и более высокого порядка точности, опираю- 
щиеся на другие шаблоны, например, на девятиточечный [13, 14, 154]. 
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маций в реальных задачах почти невозможно, здесь часто при- 
меняют упоминавшийся ранее ($512.5, 14.7) приниип Рунге, 
сводящийся к тому, что проводя вычисления на сгущающихся 
сетках, сравнивают значения решения сеточной задачи в общих 
для этих сеток узлах. 

Конкретнее, если, например, проведены расчеты на квадрат- 
ной сетке с некоторым фиксированным шагом Й и получено се- 
точное решение и, , затем шаг уменьшен вдвое и на сетке с шагом 


0.5й получено решение и0.5р, иесли выполняется неравенство 
[мир —ио5и| <З=, (21.14) 


где = — заданная точность для сеточного решения в используе- 
мой сеточной норме, то в соответствии с правилом Рунге, каркас 
решения ио5„ считают верным с точностью = благодаря нали- 


чию теоретической оценки погрешности аппроксимации о? ) 
Но принцип Рунге «работает», когда кроме всех прочих ус- 
ловий, оправдывающих его применение, сеточное уравнение ре- 
шается с небольшей, чем =, погрешностью. К сожалению, в про- 
цессе ^->0 ухудшается обусловленность систем сеточных 
уравнений, что приводит к дисбалансу между желаемой точно- 
стью аппроксимации и, возможно, чрезмерно большой погреш- 
ностью решения таких систем. Это означает, что могут встре- 
титься ситуации, когда при наличии формальных гарантий 
сходимости в процессе сгущения сетки неравенство (21.14) мо- 
жет вообще не выполниться, если = окажется слишком малым, 
так как в реальном процессе дробления шага величины 
и, —ио5л| сначала убывают, отражая факт сходимости, а далее 
начинают возрастать под влиянием ошибок округления при ре- 
шении все хуже обусловленных СЛАУ все большей размерности. 
Обсудим теперь вопрос о том, какие методы могут быть 
применены для решения систем сеточных уравнений вида 
(21.13). Будем, опять таки, для простоты считать, что сетка имеет 
квадратные ячейки с шагом Й и что общее число определяемых 
неизвестных (составляющих каркас искомого приближенного 


решения после исключения его граничных значений) есть”) 
№ = (и-1(т- В. (21.15) 


® 
) Определенное в (21.15) число № используем в рассуждениях и с 
произвольными (неквадратными) сетками. 
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Тогда если всю эту (и-ПГх(т-1)-матрицу неизвестных и; тем 


или иным способом упорядочить линейным образом, т.е. запи- 
* 
сать в виде №-мерного вектора и}, например, так ): 


шр {= (м1; м21;й И и—11$ 112;и223Й ;Ии-12; Й 


‹ ь и Г 
й; 1, т-13 2-13 т , 


то система сеточных уравнений (21.13) может быть представлена 
в обычной для записи СЛАУ форме 


Арир =Бр, (21.16) 


где №-мерный вектор Б, формируется из правых частей уравне- 
ний (21.13) в соответствии с тем, как сформирован вектор ир, а 
№ х №-матрица А; — из коэффициентов этих уравнений. 

Для решения М№-мерной линейной алгебраической системы 
(21.16), в принципе, можно применять любые методы, прямые и 
итерационные, в частности, методы, изложению которых посвя- 
щены гл.2 и гл.3. Если максимальная размерность № систем 
(21.16) невелика, то на выборе способа их решения можно не за- 
острять внимания и использовать стандартные методы, напри- 
мер, метод Гаусса. Однако при решении более-менее сложных 
прикладных стационарных задач приходится пользоваться сет- 
ками, имеющими десятки, а то и сотни тысяч узлов, и, как след- 
ствие, такое же громадное число неизвестных в системах вида 
(21.16). В подобных случаях не обойтись без выбора более эф- 
фективных методов по требуемым вычислительным затратам, 
чем обычный метод Гаусса, количество затрачиваемых арифме- 
тических операций в котором составляет величину О\М№М О, Ясно, 
что построение таких эффективных методов немыслимо без уче- 
та специфики систем (21.16). 

Основной особенностью систем (21.16), составленных из 
разностных уравнений (21.13), присущей им независимо от вида 
исходного эллиптического уравнения, конфигурации области ©, 
типа граничных условий и способа их аппроксимации, является 
разреженность матрицы системы Ар, т.е. тот факт, что 
большинство ее элементов — нули. Структура же матрицы 
Ар, т.е. расположение в ней ненулевых элементов (элементов, 
не являющихся заведомо нулями), зависит и от вида исход- 
ной области О, на которой задано решаемое эллиптическое 
уравнение, и от типа поставленной для него краевой задачи, и от 


способа упорядочивания неизвестных и. 


х 
) Такой способ упорядочивания называют лексикографическим [138]. 
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При выполнении обычных гауссовых преобразований ис- 
ключения без учета структуры матрицы Ау многие ее нулевые 
элементы постепенно заменяются ненулевыми, т.е. при выпол- 
нении прямого хода метода Гаусса матрица А, теряет свойство 
разреженности. Хотя в общем случае такой процесс неизбежен, 
существует стратегия выбора главного элемента, при которой 
удается достичь компромисса между численной устойчивостью и 
минимальным заполнением матрицы ненулевыми элементами, 
что ведет к уменьшению совокупного числа «существенных» (не 
над нулями) арифметических операций. Одна из таких страте- 
гий называется стратегией или схемой Марковииа и составляет 
основу алгоритмов минимальной степени, с которыми можно 
ознакомиться, например, с помощью книг [64, 197]. 

При решении СЛАУ большой размерности прямыми мето- 
дами систему обычно сначала представляют в блочной форме, 
стараясь при этом максимально учесть структуру матрицы сис- 
темы. Такой подход позволяет резко сократить объем вычисле- 
ний и снизить требования к оперативной памяти вычислительной 


машины), поскольку здесь решение одной большой СЛАУ сво- 
дится к решению нескольких СЛАУ меньшей размерности, из 
которых весьма значительная часть — с заведомо нулевыми мат- 
рицами и правыми частями. 

Чтобы продемонстрировать, что может дать блочный под- 
ход к решению сеточных СЛАУ, рассмотрим разностную схему 
(21.5)-(21.6) для уравнения Пуассона в прямоугольной области с 
сеткой с квадратными ячейками. При й =й> =Й разностное 


уравнение (21.5) имеет наиболее простой вид: 
2 
и, } ЧИН / —4и; Ь и; 1 ЧИ, +1 =й Л» (21.17) 


где 1=1,2,й ‚п-1, 1=12,й ‚т-1. Согласно (21.6), это урав- 
нение доопределяется условиями 


10; = 20, Ин; = Фи У]е,2,й ‚т-Ц, (21.18) 
ии =, ит=Фи У1еЕ{12,й ‚п-|. (21.19) 


* 

в случае использования системы параллельной обработки ин- 

формации разбиение на блоки просто необходимо, но рационально учиты- 
вать структуру матриц при этом сложнее. 
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нееееененние —— 71=2 


а ж—— }=1 
(1,1)| (2,1) (п- 2,1) (п-1,1) 


а =—— ]=0 


Рис. 21.6. Частный случай сетки рис. 21.1, 
соответствующий значению т=2 


Предположим, что т=2, т.е. сетка © состоит только из 
одной «линейки» внутренних узлов (р,1) (рис.21.6). Тогда из 


(21.17) при 7 =1 получаем уравнение, 
2 
ии +щатей” 7-м -ир, 


которое с учетом равенств (21.18), (21.19) можно записать в виде 
системы 


2 
— 4 1+ и21 =Й” Лт — 910 — Ф12 — 901, 
2 
и 11-4 чина ЕЙ“ -Фю-Фр (@(=2Й ‚п-2), 
2 
от - Чи ЭЙ ры - Фо -Я12-Фщ. 


Эта трехдиагональная (и-—1)-мерная СЛАУ представляет собой 
частный случай системы (21.16), которому придаем следующий 
векторно-матричный вид: 


Ти! =Б, 
где 
—{ 1 бб оо 11 
1-41) 0 0 (21 
Г :—| сколов ‚ШЕЕЙ ‚ (21.20) 
оО ф4 1 Ип-2,1 
о 0 Ол 1 -—4 
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2 

й` Лу - 910 — 912 — 901 
:] 

й- 21 — Ф20 — @22 


2 
Й" 1-21 — Фи-2,0 — Фи-2,2 


2 
й и-л—Фи-ьо — Фи-12 Фи 
Теперь положим т=3, т.е. рассмотрим ситуацию, когда 
сетка на данном прямоугольнике состоит из двух рядов внутрен- 
них узлов (рис. 21.7). 


Рис. 21.7. Частный случай сетки рис. 21.1, 
соответствующий значению т=3 


В таком случае, полагая в (21.17) /=Ти 1 =2, получаем (с 
учетом условий (21.19)) следующую систему: 


2 
и-11— Чидл ити =Й Л -ФЮ, 
— 12 
ил +; 1,2 — 42 ин, 2 =Й 72 -Фв, 
где! =1,2,Йй ‚п-| и известны значения 


01 = 901» Им =Фи, 102 = 902, Ино = Фи2. 
Если дополнительно к обозначениям (21.20) обозначить 


и12 п? 1-ю Фо 
и 22 1 -Ф20 
и ;=| й | ых зо анакь : 
Ип—2,2 21 Фи_2,0 
Ин-1,2 В? — Фи 0 -т 
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2 

й^ 2 —Ф1з — 02 
2 

Й^ 122 — Ф23 


2 
й Ти 2 Фи-2,3 

2 
В .1 5 -Фиаз —Фо 


то последнюю систему, как легко убедиться непосредственной 
проверкой, можно представить в блочном виде 


Т :. и] и Ь 
ЕТ и) — Ь> | 
что равносильно записи в виде системы из двух (и-1)-мерных 
векторно-матричных уравнений 
Ти +и› =Ь:, 
Зе ее, (21.21) 
1 + Ти> = Ь> 


или одного векторно-матричного уравнения (21.16), где А, — 
ТЕ 
симметричная матрица и а векторы и) и Ъ; составляются 
из двух одноименных векторов, именно 
и! 1 
ид = ‚ би=| > |. 
2 ь> 
Если продолжить такой процесс увеличения значений т, то 


при переходе от т =3 к т = 4 система (21.21) заменяется систе- 
мой вида 


Ти! +и> =Ъ, 
и] +Ти> + 3 =Ь>, (21.22) 
и) + Тиз =Ъ: 


(значок - над Бу; показывает, что К-й вектор свободных чле- 
нов подвержен влиянию граничных условий и =Фи, 
И2т = Ф2т), ИТ.Д. 


При произвольном т>4 соответствующая (21.17)—(21.19) 
№-мерная система (21.16) имеет блочно-трехдиагональную 
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структуру 
Ти, +и> =Ы, 


и + Ти, чи =Б; (1=2,й ‚т-2), (21.23) 


—> 


Ш + Ти, = Би , 


вид которой говорит о возможности обобщить на этот случай из- 
вестный метод прогонки (2.6). Действительно, такое обобщение 
существует, причем для блочно-трехдиагональных систем более 
общего вида 


Ва + См =Е, 
А м; +В м, +С м =}, (ТЕЗ Л ‚т-2), 
Ат + Вит = Еж 


(в таком виде можно записывать системы сеточных уравнений 
(21.13) с пятидиагональными матрицами Ар), и называется ме- 
тодом матричной прогонки [103, 154, 159, 161]. Хотя его эф- 
фективность существенно выше, чем у обычного метода Гаусса, 
все же он не столь экономичен, как это можно было ожидать, по- 
скольку на каждом этапе прямого хода приходится обращать 


(п_1)-мерные матрицы”). 

Имеются и более эффективные прямые методы решения та- 
ких специфических СЛАУ, которые возникают при конечнораз- 
ностной аппроксимации уравнений Пуассона в прямоугольной 
области, например, метод БИФ (быстрого преобразования Фу- 
рье), опирающийся на метод разделения переменных в системе 
сеточных уравнений [13, 14, 78, 158]. В частности, для решения 
систем вида (21.23) разработан весьма экономичный (с числом 
операций О(М№)) так называемый марш-алгоритм, описание ко- 
торого можно найти в книге [153]. 


21.3. ОБ ИТЕРАЦИОННОМ РЕШЕНИИ 
СЕТОЧНЫХ УРАВНЕНИИ 


При решении систем сеточных уравнений с большими раз- 
реженными матрицами, возникающих при конечноразностной 
аппроксимации краевых задач для эллиптических уравнений, 


* 
) При изменении направления упорядочивания неизвестных (сна- 
чала вдоль оси Оу, а затем вдоль оси Ох) нужно обращать (т -— 1)-мерные 


матрицы. Обычно, упорядочивание производят так, чтобы обращать мат- 
рицы меньшей размерности. 


775 


часто отдают предпочтение итерационным методам в силу сле- 
дующих обстоятельств. Во-первых, реализация таких методов 
намного проще. Это преимущество перед прямыми методами 
особенно заметно в случаях, когда области ©, на которых зада- 
ются эллиптические уравнения, имеют сложную форму, что по- 
рождает проблемы с учетом структуры матриц коэффициентов 
Ар в (21.16) при построении прямых алгоритмов исключения с 
минимальным заполнением и что практически никак не отража- 
ется при использовании тех или иных итерационных методов. 
Во-вторых, итерационные методы заведомо менее требовательны 
к памяти компьютера, чем любые прямые методы. В-третьих, как 
правило, использование подходящих итерационных методов по- 
зволяет получить выигрыш и в общем объеме вычислений при 
решении разностным методом с заданной точностью стационар- 
ных задач с большим количеством узлов. 

Большое удобство при реализации итерационных методов 
создает тот факт, что представление системы сеточных уравне- 
ний в виде (21.16) нужно лишь номинально: для того, чтобы уви- 
деть структуру матрицы А) системы, изучить ее свойства, выяс- 
нить вопросы применимости того или иного метода, получить 
оценки погрешности и т. п.; организация же собственно итераци- 
онных вычислений производится на основе самой записи разно- 
стного уравнения. Отсюда ясно, что здесь нет характерной для 
прямых методов проблемы возможного замещения нулевых эле- 
ментов ненулевыми. 

Для простоты будем опять ориентироваться на разностную 
схему (21.17)-(21.19), построенную для задачи (21.1)-—(21.2) в 
прямоугольнике на шаблоне «крест» с шагом Й по х и у, имея 
при этом в виду, что все нижеследующее легко переносится на 
общий случай сеточных уравнений вида (21.13) (и не только их), 
а сложности появляются лишь при обосновании сходимости та- 
ких обобщений. 

Начнем с метода простых итераций. 

Учитывая, что при принятом за основу упорядочивании не- 
известных и, по одному из направлений координатных осей 


матрица А; системы (21.16) является пятидиагональной с диа- 
гональным преобладанием (в отдельных случаях, где содержится 
три или четыре ненулевых элемента, — строгим, в остальных — 
нестрогим, см. (21.23) совместно с (21.20)), естественно попы- 
таться использовать МПИ (3.1) в форме метода Якоби (3.2). Для 
данного случая, в соответствии с разностным уравнением 
(21.17), это означает, что основная расчетная формула метода 
Якоби есть 


2 
(+1) ы{ (К) (К) (К) (К) | г 
и Ми +, АР Ай (21.24) 
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где К — номер итерации — принимает последовательно значе- 
ния 0,1,2,й ; при каждом значении А, начиная с нулевого (при 
котором начальные значения и) неизвестных и;, считаются за- 
данными), индексы Ги / изменяются от 1 до и-1 и до т-1 со- 
ответственно, причем порядок их изменения здесь роли не игра- 


ет. При крайних значениях Ги /, т.е. при {=1 или =и-Ти 
71=1 или / =т-1, хотя бы одна из величин ще р ий р р 
и(® | за счет краевых условий (21.18) и (21.19) переходит в раз- 


+1 
ряд известных при любых К = 0,1,2,й . 

Наличие нестрогого диагонального преобладания в 
матрице А, говорит о том, что ситуация со сходимостью итера- 
ционного процесса (21.24) — критическая. Действительно, 
совершенно очевидно, что естественные легко вычислимые нор- 
мы матрицы итерирования в (21.24), подчиненные, например, 
норме-максимум или норме-сумме вектора и), равны единице, 
т.е. здесь неприменимы теоремы о достаточных условиях сходи- 
мости МПИ типа теоремы 3.2. В то же время, более детальное 
изучение этой матрицы (обозначим ее У) показывает [138], что 
ее спектральный радиус 


Р(9ь) = созлй =1-0.512 1? <1 МИ>0, (21.25) 


следовательно, сходимость процесса (21.24) к решению системы 
сеточных уравнений (21.17) гарантируется теоремой 3.1 о необ- 
ходимых и достаточных условиях сходимости МПИ. Однако 
скорость сходимости этого процесса, в силу близости к единице 
спектрального радиуса матрицы итерирования, будет заведомо 
низкой и заметно ухудшаться с уменьшением шага, из чего мож- 
но сделать вывод о нецелесообразности применения такого ме- 
тода при сколько-нибудь значительном числе узлов сетки. 

Как следует из материала главы 3, в данной ситуации мож- 
но надеяться на лучшие результаты (без увеличения объема вы- 
числений), применив к системе уравнений (21.17) метод Зейделя, 
запись основной расчетной формулы которого, в соответствии с 
(3.13), имеет вид 


: 2 
ие = ЦН +0) Ни чи Ел, (21.26) 


й ДАНЬ 2, ] +1 
где так же, как и в (21.24), при каждом К =0,1,2,й полагаем 
1=12,Й ,п-1, 1 =2,Й ‚т-Т и учитываем краевые условия 


(21.18), (21.19). Утверждение о сходимости процесса Зейделя 
(21.26) можно считать следствием, например, теоремы 3.10. 
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И метод Якоби (21.24), и метод Зейделя (21.26) (известные в 
этих специфичных вариантах еще и под названием метод Либмана 
[27, 62, 115, 126]) ввиду их медленной сходимости малоприем- 
лемы для расчетов с мелкими сетками, что обусловлено не толь- 
ко большим количеством вычислений, но и повышенным риском 
накопления при этом значительных погрешностей (см. по этому 
поводу 5 3.7). 

Уменьшить потребное для получения каркаса решения с за- 
данной точностью число итераций метода Зейделя (21.26) можно 
введением в него параметра релаксации © е (1, 2), т.е. привле- 
кая для решения сеточных уравнений (21.17) метод ПВР (иначе, 


$ОК-метод), описанный в $ 3.4 ). 
В соответствии с записью (3.21) последовательность при- 
(4) 
у 
определяется формулой 
в = 


где через ты 


Зейделя (21.26), т.е. речь идет о парном, поочередном примене- 
нии формул (21.26) и (21.27): основной шаг, затем шаг ускоре- 
ния. Ускорение здесь действительно может быть ощутимым, ес- 
ли сделан подходящий выбор ускоряющего множителя @. Для 
каждой конкретной матрицы А, системы (21.16) имеется свое 
оптимальное значение @ пт, при котором с помощью (21.27) 
достигается максимальное ускорение итерационного процесса 
Зейделя. В некоторых случаях это оптимальное значение пара- 
метра релаксации может быть заранее подсчитано. 

Так, для матриц А), «упорядоченно согласованных со 
свойством А» (подробно об этом см. в [27]), установлена связь 
между собственными числами соответствующих им матриц ите- 
рирования ФУ, метода Якоби и матриц итерирования $,(@) ме- 
тода ПВР ($ОВ-метода), записанного в эквивалентной МПИ фор- 
ме, что позволяет подобрать значение @ =@,: таким, при 
котором минимизируется спектральный радиус р(З)) и обеспе- 
чивается наиболее быстрая сходимость последовательности при- 
ближений, получаемых методом ПВР. 


) по методу релаксации к искомым значениям и; 


ближений (, й 


ино и) (21.27) 


обозначен результат вычислений по формуле 


* 

) Применительно к рассматриваемой задаче этот метод иногда на- 
зывают ускоренным методом Либмана, а параметр @ — ускоряющим 
множителем [115]. 
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В частности, матрица Ау; системы сеточных уравнений 


(21.17) упомянутым свойством обладает, и с учетом выражения 
(21.25) по формуле [27, 138] 


О. 
@опт = —— (21.28) 
1+ - р? (3,) 


для релаксационного процесса (21.26)—(21.27) находим 


2 2 2 


от > 
1+ 1—с0$2 лй 1+зшлй 1+лй 


(21.29) 


Выигрыш в скорости сходимости при этом нетрудно оценить, 
зная, что спектральный радиус матрицы З,(@опт) для систем с 
охарактеризованными выше матрицами Ау на единицу отлича- 
ется от параметра @от Е (1, 2): 


Р($ р (@опт)) = @опт —1. (21.30) 


Подсчитав величины —1/1(р($,(@от)), —Иш(р($,(1)) и 
-У №(р(/„)), показывающие количество итераций, затрачивае- 
мых рассматриваемыми процессами (соответственно, ПВР, Зей- 
деля и Якоби) на установление в результате одного верного знака 
во всех компонентах, можно судить о сравнительном преимуще- 
стве метода ПВР, быстро возрастающем с уменьшением шага й 
(см. упр. 21.5). 

Для матриц А р, не обладающих нужными свойствами, при- 
менение формулы (21.28) (а также (21.30)) не оправдано, и зна- 
чение параметра @, обеспечивающее ускорение итерационного 
процесса, тем или иным способом подбирают. Это часто делают 
и в случаях, когда формально есть основания вычислить @опт По 


формуле (21.28), но значение р(4 „) неизвестно. 


Замечание 21.1. Существует несколько модификаций метода ПВР. 
Укажем на две из них [137]. Одна модификация опирается на запись сис- 
темы сеточных уравнений в блочном виде, поблочную реализацию метода 
Зейделя (Гаусса-Зейделя) и повекторное ускорение по формуле, подобной 
формуле (21.27); такой метод называют блочным методом ПВР (5$0ОК). 
Другая модификация направлена на устранение неравноправия неизвест- 
ных, присущего методу Зейделя (для него небезразличен порядок подклю- 
чения неизвестных при формировании вектора и, в системе (21.16)). Сна- 
чала строится симметричный метод Зейделя, состоящий из двух 
полушагов, на каждом из которых неизвестные упорядочиваются по- 
разному (в прямом и в обратном направлениях, что означает перемену ро- 
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лями нижней и верхней треугольных матриц при аддитивном разбиении 
исходной матрицы системы), затем в оба этих полушага обычным образом 
вводится параметр релаксации; в итоге получается метод, называемый 
методом симметричной последовательной верхней релаксации 
(55ОК). Утверждение о его сходимости не отличается от теоремы 3.12. 


Пример 21.1. Рассмотрим применение методов Зейделя и ПВР к на- 
хождению таблицы значений функции \/(х, у) из уравнения 


0, (21.31) 


определенного в прямоугольнике О :=[А-Ь, +В] х[-а, а], с граничным 
условием 


ух, уе =0. (21.32) 


Такая таблица может служить картой напряжений в прямоугольном сече- 
нии нагруженной цилиндрической пружины (рис. 21.8) и использоваться в 
конструкторских расчетах при вычислении коэффициентов перенапряже- 
ний (обычно задаваемых номограммами [22]). 


' < _— ось пружины 


Рис. 21.8. Сечение одного витка цилиндрической пружины 


Введя на © сетку с шагами й = 25 пох (в соответствии с чем 
п 


хх =Ю-Ь+Ш) и 12 =24 по у и применив симметричные аппроксима- 


ции ы 
09° бы 2% НИ, ты. 2+, +1 
ак2 ду? ри в? р | 
ду ИИ] 
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данное эллиптическое уравнение (21.31) аппроксимируем системой сеточ- 
ных уравнений (типа 21.13) 


Ау = В +СИнь: +В, 1+ Е; +2, (21.33 
где: 
Я 9 1 3 1 З 
Де, В 
2 п’ "р в (В-Ь+т) "в? 2Н(В-Ь+т) 


р=-Ь, ке-ы; 1-Й ,п-1, 1=12.й „т-1. 
№ #2 


Дополнительными к (21.33) служат равенства 


ол =У я =Ую =Ит =0, 
соответствующие заданному граничному условию (21.32). 
Решение СЛАУ (21.33) методом Зейделя означает проведение ите- 
раций по формуле 


А+ А К А+ К 
иен = ви +СЫ + Ри + БИ, + 2) (2134) 
(0) 


начинаемых с задаваемых значений у, 
некоторого критерия останова. Превращение метода Зейделя в метод ПВР 


сводится к тому, что при введенном предварительно значении параметра 


©@ ‚ выполнив вычисление и 


и заканчиваемых по выполнении 


по формуле (21.34), делаем присвоение 


— (^+1) ._ (+) 
Ут 2% 
и вычисляем новое (уточненное) значение 


+1) _ (К) я (К+1) К 
иг УТ +06 -и( ›) 
(все это при К=0,1,2,й ‚ 1=12,й ‚п-1, 1=Ъ2,й ‚т-1). 
Вычисления по данным формулам при фиксированных значениях 
А—18;, а=3, 5=6, пи=16, Ш=8, @-1.539, 


начальном приближении иг := 0 и критерии окончания итераций 


2 
5 И „®) < 0.0001 
Л 

дают следующую карту напряжений во внутренних узлах сетки, опреде- 
ленной указанными значениями постоянных (приводимая таблица значе- 


ний уу вдвое прорежена по направлению х по сравнению с расчетной): 


0.534 0.763 0.866 0.902 0.887 0.804 0.584 
0.868 1.279 1.468 1.535 1.508 1.356 0.959 
1.052 1.578 1.823 1.910 1.875 1.678 1.170 
т. 1.675 1.940 2.034 1.996 1.783 1.238 
1.052 1.578 1.823 1.910 1.875 1.678 1.170 
0.868 1.279 1.468 1.535 1.508 1.356 0.959 
0.534 0.763 0.866 0.902 0.887 0.804 0.584. 


Число итераций, выполненных методом Зейделя и методом ПВР, — 98 и 
23 соответственно. 
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21.4. МЕТОДЫ УСТАНОВЛЕНИЯ 


Знакомство с основной идеей методов установления на аб- 
страктном уровне, т.е. для произвольных СЛАУ безотносительно 
их происхождения, у нас состоялось в $ 3.5. В развитие этой 
идеи там же представлена общая концепция двухслойных итера- 
ционных методов, к которым, кстати, можно отнести и рассмот- 
ренные в предыдущем параграфе методы Якоби, Зейделя, ПВР. 

Конкретизация решаемых стационарных задач и учет их 
физической интерпретации позволяет придать идее установления 
определенный содержательный смысл и подобрать наиболее эф- 
фективные методы решения систем сеточных уравнений среди 
множества двухслойных итерационных методов. 

Поставим рядом рассматриваемое в этой главе уравнение 
Пуассона 


2 2 
и +9 = ух, у) (21.35) 
9х ду 
и двумерное уравнение теплопроводности 
2 2 
ди — 2 и би | тур), (21.36) 
01 ах? ду? 
численному решению которого посвящен $ 20.6. 
В частном случае, когда в (21.36) а? = и функция Г не 


зависит от переменной /[, т.е. когда уравнение (21.36) берется в 
виде 


2 2 
би би би (ху), (21.37) 
0 0х? ду? 
при 2% = 0 оно совпадает с уравнением Пуассона (21.35). Если 


для уравнения теплопроводности (21.37) задать не зависящее от 
времени /[ граничное условие 


иг = Ф(х, у), (21.38) 


соответствующее условию (21.2) в рассматриваемой задаче Ди- 
рихле, то при любых начальных условиях на функцию и(х, у, [) в 
области © с границей Г 


и(х, у, 0) = иб(х, у) (21.39) 


их влияние на решение и(х, у, Г) с течением времени { ослабева- 
ети при 1 > © 
ди 
и(х, у, Г) > и(х, у), 2-0 
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Таким образом, стационарную краевую задачу (21.35), 
(21.38) можно считать предельной для эволюционной начально- 
граничной задачи (21.37), (21.38), (21.39) и получать ее прибли- 
женное решение и(х, у) в ©, находя решение и(х, у, Г) послед- 
ней для достаточно больших /. Поскольку применение разност- 
ного метода для получения каркаса решения нестационарной 
задачи (21.37)—(21.39) означает последовательные, от {4 к 4.1 
(К =0,1,й ), вычисления, процесс таких вычислений должен 
продолжаться до тех пор, пока не произойдет выход на стацио- 
нарный режим, т.е. значения решения на (К -+1)-м слое будут 
практически (в пределах заданной точности) совпадать с соот- 
ветствующими значениями А-го слоя во всех внутренних узлах 
сетки. Это и есть пошаговое установление вычислительного про- 
цесса, соответствующее выходу физического эволюционного 
процесса в стационарный, установившийся режим. Учитывая 
экспоненциальный характер затухания влияния начального усло- 
вия (21.39), такое установление должно происходить достаточно 
быстро, и, очевидно, тем быстрее, чем лучше начальная функция 


и? (х, у) в (21.39) отражает искомое стационарное распределение 


температуры, задаваемое уравнением (21.35) и граничным усло- 
вием (21.38). 


Зная, что одним из эффективнейших методов решения задач 
теплопроводности с двумя пространственными переменными 
является метод переменных направлений (Писмэна-Рэчфорда), 
запишем соответствующие этому двухслойному методу форму- 
лы применительно к рассматриваемой задаче Дирихле для урав- 


нения Пуассона”). Главной особенностью, отличающей приме- 
нение метода переменных направлений к стационарным задачам, 
является то, что здесь шаги по времени Е, которое в записи ста- 
ционарного уравнения явно отсутствует, следует расценивать как 
итерационные шаги, т.е. индекс К, означавший в $ 20.6 номер 
слоя пространственно-временной сетки, в нижеследующих фор- 
мулах интерпретируется как номер итерации (что будем подчер- 
кивать, заключая его в скобки). В связи с этим к такому методу 
применяют название итерационный метод переменных на- 
правлений. 


* 

) Иногда при решении стационарных задач используют и трехслой- 
ные итерационные методы, сводя эти задачи к эволюционным задачам с 
гиперболическими уравнениями. 
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В соответствии с формулами (20.60), (20.61) для задачи 
(21.35), (21.38) на введенной ранее на © сетке узлов ху; 
имеем: 


{9 [226 }. Е 2 ей 4+2 228. О и® ,, (21.40) 


и, й и, р 


Е [2 2) и у и 2 «(2 #9 (21.41) 


Определяемый этими формулами продольно-поперечный метод 
можно назвать полуитерационным методом в двух смыслах. Во- 
первых, здесь делается как бы половина итерационного шага од- 
ного направления, затем — вторая половина шага вдоль перпен- 
дикулярного прежнему направления. Во-вторых, для осуществ- 
ления каждой из этих полуитераций нужно решать СЛАУ с 
трехдиагональной матрицей, для чего применяют прямой метод, 
например, метод прогонки. 

Для начала итераций в формуле (21.40) полагаем А=0, 
подставляем соответствующие выбранной начальной функции 


* 
и0(х, У) значения ) 


и . 
=и (хр У), 

фиксируем 1 =1й р и при каждом фиксированном / изме- 

няем Гот | до и-1; получаемые при этом трехточечные разно- 

стные уравнения второго порядка дополняем краевыми условия- 

ми в соответствии с вытекающими из (21.38) равенствами 


и решаем прогонкой. Пользуясь найденными значениями и,” , 
при том же К аналогично поступаем с формулой (21.41): фикси- 
руем поочередно Г от 1 до и-1 и при каждом фиксированном 1, 
изменяя / от | до т-1, с помощью дополнительных равенств 


(+1) +1 
и = Ид = Ф(х;, Уд), ии Е 


прогонкой вычисляем значения иг ) ‚› служащие результатом пер- 


(0) 


* 
) Если нет хорошего начального приближения (и (, й ) здесь особен- 


но кстати может оказаться использование сгущающихся сеток: получая 
«дешевое» решение на крупной сетке, принимаем его расширение на бо- 
лее мелкоячеистую сетку в качестве начального приближения для новых 
итераций, и т.д. 
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вого полного итерационного шага. Затем переходим к следую- 
щей итерации и т. д. Окончание этого процесса может быть, на- 
пример, таким: 

и (+0 — 
й 


и 5 > им; жи. 


тах |и й: й 


ь/ 
Другим критерием окончания итераций по формулам (21.40)- 
(21.41) можно считать условие 


(А-П) (К) 
о Но 
т 
означающее факт установления процесса с точностью 5: 
ди 
[<= [92 
о < [92] 


Отдельный разговор о том, как распорядиться итерацион- 
ным параметром т в рассматриваемом методе, выбор которого, 
несомненно, отражается на скорости сходимости метода. Вопрос 
этот весьма непрост, и нельзя сказать, что на него всегда можно 
дать исчерпывающий ответ, устраивающий практиков. 

Ясно, что параметр т может быть как одним и тем же по- 
стоянным в обеих формулах вида (21.40) и (21.41), так и различ- 
ным: в одном направлении — 71, а в другом — то; в любом слу- 
чае, должны существовать оптимальные значения Тот (для 
каждой эллиптической задачи, для каждой области ©, для каж- 
дой сетки свои), при которых каркас решения с нужной точно- 
стью находится за наименьшее число итерационных шагов. По- 
иск таких значений То: производится с помощью изучения 
погрешности метода, т.е. разности между каркасом точного ре- 
шения на используемой сетке ©), и результатом К-йЙ итерации 


данным методом. Имеются некоторые общие утверждения о том, 
какими должны быть значения Тот В зависимости от свойств со- 
ответствующих задаче и методу разностных операторов [158, 
159], и конкретные рекомендации в случаях, когда оговоренные 
свойства этих операторов изучены и известны, например, их соб- 
ственные значения или хотя бы границы спектра [78, 158, 159]. 

В частности, в методе, определяемом формулами (21.40), 


(21.41), для уравнения Пуассона (21.35) в прямоугольнике © та- 
ким оптимальным значением параметра т считается значение 


ПЕ 1 
т  25щ(лй) 2л’ 
обеспечивающее достижение точности = при решении сеточных 


—Ш= 


уравнений приблизительно за 2 | ЧИСЛО итераций. 
. 
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Большой выигрыш в числе итераций может быть получен 
варьированием значений итерационного параметра от итерации к 
итерации. В некоторых случаях удается выписать конечные на- 
боры таких значений т; (связываемые обычно с корнями много- 


членов Чебышева и задаваемые после того, когда уже известно 
требуемое для достижения нужной точности число итерацион- 
ных шагов), которые обеспечивают наиболее быстрое затухание 
начальных данных в методах установления. 

В оптимизации значений итерационных параметров т или 
их конечных последовательностей (т, ) нуждаются также так на- 


зываемые попеременно-треугольные итерационные методы 
(ПТИМ), относящиеся к семейству неявных двухслойных мето- 
дов вида (3.28) и на модельных задачах типа задачи Дирихле для 
уравнения Пуассона в прямоугольной области демонстрирующие 
самую высокую эффективность. Согласно [159], асимптотиче- 
ская (при А->0) оценка числа итераций, позволяющего найти 
каркас приближенного решения такой задачи с точностью =, со- 
ставляет для ПТИМ с оптимальным (чебышевским) набором па- 
1 
2\/лй 


ванным значением Т=тТ.иг — порядка А (каки у 
лй = 


итерационного метода переменных направлений). Для примени- 
мости попеременно-треугольного метода к системе (21.16) се- 
точных уравнений требуется, чтобы ее матрица А, была сим- 


метричной положительно определенной. 


раметров т, величину порядка ш-1, а с одним фиксиро- 
= 


УПРАЖНЕНИЯ 


21.1. Составьте систему сеточных уравнений, аппроксимирующих 
на квадратной сетке с шагом й=0.5 уравнение 


0?и , д?и 
—— 5, 
хх? д? 

х2 +у? <1, 


заданное в полукруге с границей Г, в случае граничных ус- 


у>0 
ловий вида: 


а) и(х, У) =к+У- Г; 
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ди у-зшлх, у>0, 
6) и-— = 
[21] (х;У)ЕГ 0, у=0. 


Каковы порядки аппроксимации построенных разностных схем? 
Найдите решения полученных СЛАУ. 


21.2. Запишите выражения векторов Бо, Ь; в правой части сис- 
темы (21.22) и вектора 6, в правой части блочно-трехдиагональной 
СЛАУ (21.23) при /е{2,3,й ‚т-2}. В каком виде следует представить 
вектор Ъ ,, чтобы его выражение удовлетворяло также значениям /=1 и 
71=т-1? [138]. 


21.3. По аналогии с выводом метода прогонки для решения трех- 
диагональных СЛАУ ($ 2.6) выведите расчетные формулы (на блочном 
уровне) метода матричной прогонки для решения  блочно- 
трехдиагональных СЛАУ, конкретно, систем сеточных уравнений (21.17), 
соответствующих задаче Дирихле для уравнения Пуассона (21.1)-(21.2), 
записанных в виде (21.23). 


21.4. Запишите метод ПВР (21.26)—(21.27) для решения сеточных 
уравнений (21.17) в виде одной расчетной формулы (3.23) [161]. 


21.5. Пользуясь формулами (21.25), (21.29) и (21.30), сравните вы- 
игрыш в числе итераций при решении систем сеточных уравнений (21.17) 
методом Якоби (21.24) и методом ПВР (21.27) с @ =@от из (21.28) при: 

а) й=0.1; 6) й=0.01; в) й=0.001. 


21.6. А) Перепишите расчетные формулы (21.40)—(21.41) итераци- 
онного метода переменных направлений для случая, когда шаги сетки по 
координатам неодинаковы. 

Б) Обобщите формулы (21.40)—(21.41) на случай первой краевой за- 
дачи для произвольного двумерного уравнения эллиптического типа 
(21.7). 


21.7. Примените итерационный метод переменных направлений к 
граничной задаче (21.31)-(21.32) примера 21.1 (см. $ 21.3) в условиях, при 
которых представлены в нем численные результаты. Варьируя значения 
итерационного параметра т, попытайтесь минимизировать количество 
итераций. 
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ЗАКЛЮЧИТЕЛЬНОЕ ЗАМЕЧАНИЕ 


(о том, чего в этой книге нет, но автору хотелось бы видеть) 


Несмотря на внушительный объем данной книги, имеется ряд во- 
просов, которые тесно связаны с материалом книги, но по разным причи- 
нам либо вовсе в ней не затрагивались, либо рассматривались лишь 
поверхностно без погружения в соответствующую теорию, либо только 
упоминались в том или ином контексте. Чтобы читатель, изучающий или 
применяющий вычислительную математику, не упускал эти вопросы и 
темы из виду, перечислим их, сопроводив ссылками на учебные пособия и 
монографии, с помощью которых можно хотя бы частично восполнить со- 
ответствующие пробелы. Перечень этот приводится в порядке условно 
первого соприкосновения с текстом книги (без учета того, идет ли речь о 
частном вопросе или о крупном разделе) и не претендует на полноту. 


1. Сообщение сведений о мультипроцессорных системах обработки 
информации и о сравнительных возможностях распараллеливания и кон- 
вейеризации известных методов вычислительной линейной алгебры [2, 29, 
137, 146]. 


2. Вывод формул, обоснование и использование сингулярных раз- 
ложений матриц [43, 99, 135]. 


3. Более детальное изложение процесса ОВ-факторизации матриц и 
ОК-алгоритма решения полной алгебраической проблемы собственных 
значений [42, 43, 54, 71, 75, 137, 141, 179]. 


4. Подробное описание методов локализации (как вещественных, 
так и комплексных) корней многочленов с вещественными коэффициен- 
тами и метода Лобачевского-Греффе их вычисления [17, 20, 61, 72]. 


5. Краткое изложение основных численных методов решения задач 
минимизации функции одной и нескольких переменных [3, 32, 49, 52, 68, 
73, 78, 108, 139, 178]. 


6. Введение понятия чебышевской интерполяции и рассмотрение ал- 
горитмов Ремеза и Валле-Пуссена построения многочленов, близких к 
многочленам наилучшего равномерного приближения [19, 63, 73, 107, 
134, 150]. 


7. Демонстрация возможностей и достоинств использования для ап- 
проксимации функций систем из тригонометрических и рациональных 
функций, описание и простейшие применения быстрого дискретного пре- 
образования Фурье, ознакомление с идеей функций-всплесков [14, 16, 18, 
82, 88, 159, 161. 


8. Показ техники параметрического представления многочленов от 
одного и двух переменных и ее использования при построении кривых и 
поверхностей Безье и Кастельжо [82, 119, 120]. 


9. Ознакомление с методикой использования К-функций Рвачева 
[143]. 
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10. Исследование погрешности построенных в гл. 11 сплайнов и по- 
строение сплайнов периодических, сглаживающих и двумерных [1, 24, 91, 
ПТ, 14, 167]. 


11. Охват многомерного случая при рассмотрении задач интерполи- 
рования и численного интегрирования. Описание метода статистических 
испытаний (Монте-Карло) вычисления кратных интегралов [12, 13, 14, 19, 
61, 70, 71, 78, 104, 122, 123, 143, 178]. 


12. Более глубокое изучение одношаговых многостадийных методов 
Рунге-Кутты решения задачи Коши для ОДУ и базирующихся на нем ал- 
горитмов [6, 20, 60, 185]. 


13. Построение регуляризирующих алгоритмов для численного ре- 
шения интегральных уравнений Фредгольма первого рода с описанием 
способов выбора параметра регуляризации [11, 13, 14, 28, 34, 41, 73, 78, 
128, 175]. 


14. Более строгое изложение сеточных методов (в частности, проек- 
ционной природы), позволяющих находить обобщенные решения задач 
математической физики, сопровождаемое введением пространств Соболе- 
ва [9, 117, 136, 155, 160, 172, 191]. 


15. Конкретизация определений устойчивости для разностных схем, 
аппроксимирующих стационарные и эволюционные задачи математиче- 
ской физики, и проведение соответствующих им исследований на устой- 
чивость [13, 14, 20, 55, 103, 154—159, 181]. 


16. Рассмотрение идеи расщепления, применяемой при решении 
систем сеточных уравнений, на матрично-операторном уровне [43, 117, 
118, 153]. 

17. Ознакомление с методом фиктивных областей (погружение про- 
извольной конечной плоской области задания двумерной краевой задачи в 
прямоугольник) [14, 117] и с многосеточным методом Федоренко, позво- 
ляющим эффективно использовать чередование решения сеточных урав- 
нений на грубых и мелких сетках [14, 56, 152, 181, 191]. 


18. Более подробное рассмотрение блочного подхода к решению 
систем сеточных уравнений, порождаемых конечноразностными и конеч- 
ноэлементными методами решения стационарных задач математической 
физики [29, 64, 137]. 


19. Описание (хотя бы на идейном уровне) методов граничных инте- 
гральных уравнений и граничных элементов решения краевых задач мате- 
матической физики [152, 182]. 


20. Повсеместный подсчет количества требуемых для реализации 
численных методов арифметических операций или его асимптотики [14, 
78, 159]. 
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ПРИЛОЖЕНИЕ 1 


НЕКОТОРЫЕ СВЕДЕНИЯ ИЗ 
ФУНКЦИОНАЛЬНОГО АНАЛИЗА 


1. МЕТРИЧЕСКИЕ ПРОСТРАНСТВА 


Пусть Х — множество элементов произвольной природы, объеди- 
ненных по какому-либо признаку. 

Определение 1. Л/ножество Х называется метрическим 
пространством, если любой паре его элементов х, у сопоставля- 
ется вещественное число р(х, у), называемое расстоянием между 
х иу или метрикой и удовлетворяющее следующим трем аксио- 
мам (неотрицательности, симметричности и треугольника): 

1) ^(х,у)>0, причем р(х,у)=0 © х=у; 

2) р(х,у)= (ох); 

3) р(х, у) < р(х,2)+ р(е,у) У2Е;Х. 

Например, множества О, В, (С рациональных, вещественных и 


комплексных чисел можно считать метрическими пространствами с есте- 
ственной для числовых множеств метрикой р(х, у) =х-у|. 

Аксиомы 1)-3) определяют метрику неоднозначно, а следовательно, 
на одном и том же множестве хе могут быть заданы разные метрические 
пространства, т.е. метрическим пространством, вообще говоря, считается 
пара (Х, р). Однако часто метрическое пространство обозначают одной 
буквой, совпадающей с обозначением исходного множества, когда без- 
различно, о какой метрике идет речь, или присваивают специальные на- 
именования наиболее употребительным конкретным метрическим про- 
странствам. 

На метрические пространства распространяются многие основные 
понятия классического анализа. Приведем некоторые из них. 


Определение 2. Элемент х метрического пространства 
Х называется пределом бесконечной последовательности элемен- 
тов хи из Х, если р(х„,х)———>0. В этом случае говорят, что 
последовательность (х„) сходится к х по метрике пространства 


Х ‚ и отражают это записью х„ > х или Шт хх, =Х. 
п>>о 


Единственность предела выводится из аксиомы треугольника. 
Определение 3. /оследовательность (х„) элементов мет- 


рического пространства Х называется фундаментальной (или 
сходящейся в себе), если р(х„,хт)-—0 при п, т— 0. 


Легко видеть, что всякая фундаментальная последовательность ог- 
раничена, т.е. 


УкЕМ 3,>0 УпеМ: р(х,хь)<г. 
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Фундаментальность последовательности элементов х„ Е Х является 
необходимым условием для ее сходимости. Действительно, если 
х=Шихи, то р(хи,х) 0 и р(хт,х)-> 0; но тогда по аксиоме треуголь- 
ника следует 

ие ром бя) 5550, 
т—>о 
т.е. фундаментальность (х„ ). 

Обратное неверно: не всякая фундаментальная последовательность 
элементов метрического пространства имеет предел. Например, в упомя- 
нутом пространстве © рациональных чисел с метрикой р(х, у) =|х- У 
можно построить сколько угодно фундаментальных последовательностей, 
сходящихся к иррациональным числам (пределы есть, но они принадле- 
жат не этому пространству, а его расширению). 


Определение 4. Метрическое пространство Х называет- 
ся полным, если в нем всякая фундаментальная 
последовательность имеет предел. 


Возвращаясь к примеру, отметим, что метрическое пространство О 
не обладает полнотой, а множества В вещественных чисел и С ком- 
плексных чисел — полные метрические пространства. 

Известно, что каждое вещественное число представимо как 
предел последовательности рациональных чисел. Следовательно, если 
метрическое пространство @ пополнить его всевозможными предельны- 
ми точками, то получится метрическое пространство В, т.е. О всюду 
плотно в В согласно следующему определению. 


Определение 5. Множество М элементов метрического 
пространства Х называется всюду плотным в Х ‚ если каждый 
элемент х из Х представим в виде предела последовательности 
(х„ ) элементов из М. 


Определение 6. Метрическое пространство Х называет- 
ся сепарабельным, если в нем существует счетное (или, в частно- 
сти, конечное) всюду плотное подмножество. 


Так как множество рациональных чисел @ — счетное и О всюду 
плотно в В, то метрическое пространство ® вещественных чисел сепара- 
бельно. 

Неоднозначность построения метрик по определяющей их системе 
аксиом для одного и того же множества Х’ требует установления отноше- 
ния эквивалентности между ними. 


Определение 7. Две метрики, определенные на одном и 
том же множестве Х , называются эквивалентными, если сходи- 
мость последовательности элементов из Х по одной их них озна- 
чает сходимость этой последовательности и по другой метрике. 


Равносильным данному является другое определение эквивалентно- 
сти метрик р! (х, у) и ро (х, у) на множестве Х : через существование чи- 


сел с1 >0, с> > 0 таких, что 
с1ри(х, у)< р2(х, у) <сор(х у) УхуеЕХ. 
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Примеры метрических пространств. 1) На множестве В,„, эле- 
ментами которого служат упорядоченные совокупности из и веществен- 
ных чисел (называемые и-мерными векторами, кортежами или энками) 
х=(х,й ,х,), УЕ(У,Й ‚Уи), Й , наиболее употребительными являются 
следующие метрики: 


а х,у)= шах [х,-у:; 
) р(х,у) мы У 


6) р(х,у)= 5 »,)? (евклидова метрика); 


в) р(х,у)= Ук —У. 
= 


Эти разные метрики приводят к различным уточнениям понятия 
сходимости в определяемых ими на В, метрических пространствах, од- 
нако доказано, что в конечномерных пространствах все метрики эквива- 
лентны. 

Аналогично метризуется и множество С, векторов, координатами 
которых являются комплексные числа. 


2) Рассмотрим множество, элементами которого служат бесконеч- 
ные последовательности вещественных чисел: х=(х|, х2,й ‚х,,Й ), 
У= (1, У2,Й ‚у,,й ), Й , причем такие, для которых имеет место сходи- 
< 2 2 

мость рядов из квадратов этих чисел, т.е. Ух; <®, У\у; <®,й .Введя 
= = 

на этом множестве метрику 


р(х,у)= 


› 


приходим к полному сепарабельному метрическому пространству, обо- 
значаемому /5 или м, Через метрику 
1 


рбьз)= [би -э5 (1) 
= 
пространство /› обобщается к пространству /, (или (Р), где р>1. 


3) Пусть Х — множество всех вещественнозначных функций х(!), 
у(г), й , определенных и непрерывных при г [а, в] . Введя метрику 


р(х, у)= ди |) — (И, 


получаем метрическое пространство, называемое пространством непре- 
рывных функций и обозначаемое С[Га,Б], С(а,6]) или С|а, 5]. В отличие 


от этой метрики, называемой равномерной или чебышевской, на том 
же множестве непрерывных на [а,6] функций метрику задают также 
равенствами 
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р(х, у)= 


Ь Ь 
[Го®-хоР и о ру = [к - Уи, 


приходя к метрическим пространствам, обозначаемым как С>[а,6] или 
С, [а, В] и С ([а, 6] или С „а, 6] соответственно. На этом множестве уже 
нет эквивалентности метрик: например, из сходимости последовательно- 
сти (х„(1)) по метрике пространства С[ а,Ь] следует ее сходимость по 
метрике пространства С>[а, 6], но обратная импликация не верна. Про- 
странство непрерывных функций С[а,Ь] является полным сепарабель- 
ным пространством. Таким же будет и метрическое пространство 
ра, Ь] (при р>1) функций, измеримых на отрезке [а,6] и суммируемых 
на нем с р-ой степенью (в смысле интеграла Лебега). 


2. НОРМИРОВАННЫЕ ПРОСТРАНСТВА 


Пусть наряду с множеством Х элементов х, у,Йй задано какое-то 
числовое поле, например, множество всех вещественных чисел 
а, В,й . Если в множестве Х определены операции сложения (т.е. 
хХ+уЕХ) и умножения на число (т.е. ох е Х) так, что этим операциям 
присущи все свойства соответствующих операций над числами, за исклю- 
чением коммутативности умножения, то говорят, что данное множество 
Х есть линейное пространство (разновидности: линейная система, ли- 
нейное множество, линеал). 

Определение 8. Линейное пространство Х называется 
нормированным пространством, если каждому его элементу х 
ставится в соответствие вещественное число, называемое нор- 
мой и обозначаемое ||, такое, что оно удовлетворяет 
следующим трем аксиомам (неотрицательности, однородности и 
треугальн4к{ 0, причем |х|=0 < х=0; 

2) МЧ=М-В УдеВ; 

3) к+У=Ы+ УуеХ. 

Как и метрика, норма на заданном множестве не единственна. 


Теорема 1. Всякое нормированное пространство является 
метрическим. 


Действительно, пусть Х — нормированное пространство с элемен- 


тами х, у, 2,Й и нормой ||. |. Покажем, что равенство 

ро,» =|-Я (2) 
определяет метрику р в пространстве Х, индуцированную (ассоцииро- 
ванную с) данной нормой |||. Привлекая аксиомы нормы, проверяем 


справедливость аксиом метрики для (2): 
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ру =Е-У>0, при этом 
р(х, у)=0 <> [х-У|=0 = х-у=0 >х=У; 


2) р(х, у) =к- У =р-х|= р» х), так как 
[5—У=еЕоо-х=НЬ-4=ь-3 


3) род -=+2- 5-Е -Я= р, 2) + р). 


В силу теоремы 1, утверждения, касающиеся метрических про- 
странств, могут быть переформулированы в терминах норм для нормиро- 
ванных пространств. 

Если метрическое пространство с метрикой р линейно, то в нем ес- 


тественно ввести норму равенством 
= - 9 = рб, 0). (3) 


Это равенство позволяет трактовать норму элемента х как расстояние от 

него до нуля (наличие которого обязательно в линейном пространстве). 
Согласно равенству (2) и определению 2 сходимости по метрике, 

сходимость последовательности (х„) к х в нормированном пространстве 


Х означает сходимость по норме, ибо 
[х„ -2|1-0 < р(х„,х)0 © хх. 


Аналогично, фундаментальность последовательности (х,) в нормирован- 


ном пространстве Х характеризуется требованием |х„ тт 
п,т 
Определение 9. Нормированное пространство называется 
полным, если в нем всякая фундаментальная последовательность 
сходится. Полное нормированное пространство называется бана- 
* 


ховым (или В-пространством) °. 


Говоря о сходимости по норме, подчеркнем, что в связи с неодно- 
значностью введения нормы в линейном пространстве, подобно эквива- 
лентности метрик, определяется эквивалентность норм и доказывается, 
что во всяком конечномерном линейном пространстве все нормы 
эквивалентны. 


Примеры нормированных пространств. 1) Множество В, всех 
п-мерных векторов с вещественными координатами, рассматривавшееся 
в примере 1) предыдущего пункта, с определенными в нем естественным 
для векторной алгебры образом операциями сложения и умножения на 
число образует линейное пространство, на основе которого конструиру- 
ются различные нормированные пространства, например, в соответствии 
с введенными там метриками а), 6), в). Пользуясь равенством (3), из этих 


* 

) В названии пространства увековечена память о польском матема- 
тике Стефане Банахе (1892—1945) — одном из создателей современного 
функционального анализа. 
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метрик получаем соответственно следующие нормы для произвольного 
элемента х=(х1,й ‚х„) из В, : 


а) |^| „= тах |х; — (норма-максимум); 
тЕ,й п} 
п 
6) ||| > = ух? (евклидова норма); 
1=1 
п 
в) || = У (норма-сумма). 


1=1 
Иногда к этим нормам применяют геометрические названия кубическая, 


сферическая и октаэдрическая в соответствии с видом поверхности, оп- 
ределяемой уравнением |х] = сопз! ‚ когда х считается переменным ради- 


ус-вектором в трехмерном пространстве. 
Получаемые с помощью норм а)-в) пространства и-мерных векто- 
ров — банаховы. Банаховым пространство В, является и в более общей 


ситуации, когда норма вводится равенством 
1 


и 1 
15|, = [ме (/р-норма или норма Гёльдера) (4) 
1= 


с произвольным фиксированным р>1. Записанные выше нормы пред- 
ставляют собой частные или предельный случаи /„-нормы (а) р->°, 
6) р=2, в) р=й) 

2) Множество бесконечных последовательностей, суммируемых с 
р-й степенью, после введения в нем операций сложения и умножения на 
число по аналогии с такими же операциями для и-мерных векторов пре- 
вращается в линейное пространство. Это пространство — банахово при 
любом р>1 в выражении нормы 

1 


со 2 р 
= Ури |, 
= 
ассоциированной с метрикой (1) и предельной по и по отношению к нор- 
ме (4) в В,. Обозначают такое семейство нормированных пространств так 


же, как и соответствующее метрическое, — /› или / р 


3) Рассмотренные в предыдущем пункте метрические пространства 
непрерывных на отрезке [а, 5] функций легко превращаются в нормиро- 
ванные (для последних сохраняют те же обозначения) введением с помо- 
щью равенства (3) норм 


Ь Ь 
= тах к, = (0%, и = Пхи. 
«а, 5] = ь 
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Ь 
Если функции х(!) измеримы на [а,6] и ПхоР4 <®, где р>1, то на 
а 
множестве таких функций строится линейное нормированное пространст- 
во [р[а, 6] с нормой 
ИВ 
Ь р 
ы- [киа 
а 
(в выражении которой фигурирует интеграл Лебега). 
Интересно отметить тот факт, что, например, из двух нормирован- 
ных пространств, Су, [а] и Г5[а, 6], определяемых одной и той же по 


виду нормой 
1 


ь я 
ы- [Ром (5) 


полным, т.е. банаховым является, только одно: /2[а, В]. 
Важным примером сепарабельного банахова пространства является 


также пространство Су[а,6] (иначе, Са, Ь]) К раз непрерывно диффе- 
ренцируемых на [а, 6] функций х(1) с нормой 


А : 
{=> тах ВТО) (где х(0)(/) = х(0)), 
51 а, 6] 


частным случаем которого при А = 0 является пространство непрерывных 
функций С[а, 6]. 


3. ГИЛЬБЕРТОВЫ ПРОСТРАНСТВА 


Определение 9. Линейное пространство Х называется 
предгильбертовым или пространством со скалярным произведе- 
нием, если любой паре его элементов х, у можно поставить в со- 


ответствие число, в общем случае комплексное, называемое ска- 
лярным (или внутренним) произведением и обозначаемое (х, у), 


(х, у) или просто ху, удовлетворяющее следующим требованиям: 
1) <, у)=0,>х); 
2) (х+у,2)=(х,2)+(у,2) \У2Е;ЕХ; 
3) (Ях, у)=4(х, у) УЛЕС; 
4) (х,х)>0, причем (х,х)=0 < х=0. 


Предгильбертовы пространства подразделяют на унитарные, что 
полностью соответствует определению 9, где нужно лишь уточнить, что 
пространство Х рассматривается над полем (С комплексных чисел, и 
евклидовы. Последние выделяются из этого общего определения вещест- 
венностью числового поля, самого скалярного произведения (х, у) (а зна- 
чит, ненужностью знака комплексного сопряжения в требовании 1)) и 
числа Л в требовании 3). 
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В пространствах со скалярным произведением (.,-) любые два эле- 
мента х, у связаны неравенством Коши-Буняковского 


65 Ур <@,х)0 У. 


Легко проверить, что \/(х,х) удовлетворяет всем аксиомам нормы. 
Таким образом, в предгильбертовом пространстве Х со скалярным про- 
изведением (-, ) естественно вводится норма 


М =УС, х) 


(называемая нормой, порожденной скалярным произведением), и значит, 
всякое предгильбертово пространство можно считать нормированным. 
В таком случае неравенство Коши-Буняковского можно переписать в ви- 


де неравенства 
[х, УЛ =, 


называемого также неравенством Коши—Шварца. 

Наличие скалярного произведения в предгильбертовых пространст- 
вах позволяет «измерять» в них не только «расстояния», но и «углы», и пе- 
реносить на эти абстрактные пространства многие геометрические 
свойства реальных трехмерных пространств. Например, известное соот- 
ношение между длинами сторон и диагоналей параллелограмма обобща- 
ется на предгильбертовы пространства в виде так называемого равенства 
параллелограмма 


2 2 2 2 
+ УГ +к- УГ = +2ЫГ. 


Сходимость в пространствах со скалярными произведениями опре- 
деляется, в основном, как сходимость по норме, т.е. 


хи —>х, если [х„ -х|=У(х, -х,х, -х)>0. 


Ее называют сильной сходимостью (есть еще слабая сходимость: 
х„ —>х, если (х„,У)>(х,у) УуЕХ). 


Определение 10. Предгильбертово пространство называ- 
ется гильбертовым, если оно полно в норме, порожденной скаляр- 
ным произведением (т.е. в смысле сильной сходимости). 


Гильбертовы пространства (названные так в честь знаменитого уче- 


ного Гильберта ’ и обычно обозначаемые буквой Н), являясь одновре- 
менно банаховыми, играют особо важную роль в функциональном анали- 
зе и в вычислительной математике. Одной из предпосылок для этого слу- 


(х, у) 
Ы-Ы 
между элементами х и у и, благодаря этому, проектировать одни эле- 
менты на другие. 

Определение 11. Два элемента х и у из гильбертова про- 
странства Н называются ортогональными (записывают х Гу), 


жит возможность трактовать величину Е[-1, 1] как косинус угла 


* , х . . Е, 
) Гильберт Давид (НИБем Рам, 1862—1943) — крупнейший не- 
мецкий ученый, оказавший большое влияние на развитие многих разделов 
математики. 
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если (х, у)=0. Элемент хеН ортогонален множеству М = Н 
(записывают х 1 М), если х ортогонален каждому элементу у 
из М. 

Теорема 2. Пусть х — элемент гильбертова пространства 
Н, а М — некоторое подпространство Н (линейное замкнутое 


множество элементов из Н). Тогда найдется единственная пара 
элементов уЕМ и = Е М таких, что х=у+2. 


Элемент у в этой теореме о разложении расценивается как орто- 
гональная проекция произвольно заданного элемента х гильбертова про- 
странства Н на его подпространство М ‚ а элемент 2 из ортогонального 
дополнения М" подпространства М до Н — как «расстояние» от х до 
М . Так как М — в свою очередь, является подпространством Н, то у и 


2 и, соответственно, М и мт можно поменять ролями. 
Следствием теоремы 2 в ее условиях является равенство 


1? =| 2 +8, называемое теоремой Пифагора. 
Наиболее типичными примерами гильбертовых пространств могут 
* 
служить следующие пространства °. 
1) Евклидово пространство — пространство и-мерных векторов 
х=(х1,й ‚х,), У=(У,Й ‚у,), Й с вещественными координатами, где 
скалярное произведение (х, у) определяется, как и в реальных простран- 


п 
ствах, равенством (х, у) = У`х;у; и соответствует евклидовой норме. Это 


= 
пространство часто обозначают Е». 


2) Пространство Ь бесконечных последовательностей 
х=(х1,й ,х,,й ), У=(У,Йй ‚У,,Й ), Й с вещественными или комплекс- 
ными членами, для которых имеет место сходимость рядов из квадратов 
модулей членов. Скалярное произведение здесь вводится равенством 


[*.®) со 
(х, у) = Ух или равенством (х,у)= Ух, соответственно в вещест- 
1= = 
венном или комплексном случаях. 
3) Пространство 1[5[а,6] вещественнозначных функций &х(1), 
У), й , определенных при (Е[а, 6], измеримых и суммируемых с квад- 
ратом по Лебегу. Скалярное произведение в /2[а, 6] определяется равен- 
Ь 
ством (х, у) = ЕО) УП и порождает норму (5). 
а 


4. ЛИНЕЙНЫЕ ОПЕРАТОРЫ 


Под оператором А понимается отображение, т.е. правило, по ко- 
торому элементу х одного множества Х ставится в соответствие элемент 
у= Ах того же или другого множества У. Употребительна запись 
А: ХУ. 


* 
) Первый пример противоречит даваемым иногда определениям 
гильбертовых пространств как заведомо бесконечномерных. 
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Пусть Х и У — два линейных пространства над одним и тем же число- 
вым полем К и А — оператор, ставящий в соответствие элементам х линей- 
ного подпространства О(А) пространства Х элементы уЕУ. 


Определение 12. Оператор А называется аддитивным, если 
А(х: + х›)= Ах + Ах» Уж, хо Е (А). 
Оператор А называется однородным, если 
А(1х)=лАх УхеП(А) и УЛЕК. 


Оператор А называется линейным, если он аддитивен и одно- 
роден (иначе, если он дистрибутивен, т.е. если 
А(Ях| че 122 )= Я АЖ + Я2 Ах х 


Будем далее считать Х и У нормированными пространствами. 


Определение 13. Аддитивный оператор А: Х > У называ- 
ется ограниченным, если существует такая постоянная С, что 
прилюбых хе О(А) < Х выполняется неравенство 


[4х] < СЫ. 


Наименьшая из таких постоянных С называется нормой операто- 
ра А и обозначается |А|. 


Таким образом, имеет место неравенство 
[4х] <, (6) 


которое называют условием согласованности норм. 


Определение 14. Оператор А:Х —>У называется непре- 
рывным в точке хе О(А), если для любой последовательности то- 
чек х„ Е Б(А) таких, что х„ —х, справедливо Ах„ — Ах, т.е. 


|х„->|->0 = |4Ах,- 4-0. 


Характерно, что для линейных операторов непрерывность в одной 
точке области определения влечет непрерывность в любой другой точке 
этой области, и, кроме того, непрерывность линейных операторов равно- 
значна их ограниченности. В связи с этим, часто свойство непрерывности 
или ограниченности оператора включают в определение его линейности. 

Норма оператора А:Х > У, удовлетворяющая условию согласо- 
ванности норм (6), может быть получена с помощью норм пространств Х 
и У на основе следующих равенств: 


= зар МАЙ зир Дихф= зар 4 <) 
хео [а Е 
(называемых иногда условиями подчиненности норм). 

Введя над операторами линейные операции (суммой определенных 
на Х операторов А и В называется такой оператор И = А+В, что 
Их = Ах+ Вх УхеХ, а произведением оператора А на число ДА — такой 
оператор Г := АА, что /х=ЛАх Ухе Х), можно показать, что множест- 
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в0 всех линейных непрерывных операторов из Х в У само образует ли- 
нейное нормированное пространство, которое обычно обозначают 
ЦКХ,У) или [Х > У], причем нормой элементов этого пространства мо- 
жет служить операторная норма (7). Если пространство У — полное, то и 
пространство /(Х, У) — полное, т.е. банахово. 

Определив произведение операторов А:У-7 и В:Х-—У как 
оператор С = АВ: Х 1 такой, что Сх= АВх= А(Вх) УхеХ, можно 
убедиться, что если А и В — линейные непрерывные, то и оператор АВ 
будет таким же, причем 

[ав < |481, (8) 


Пусть Х — нормированное пространство и / — тождественный 
оператор в Х (т.е. х=х \УхеЕХ). Тогда, если А и В принадлежат про- 
странству [(Х, Х), тои АВЕ МХ, Х), и это пространство линейных не- 
прерывных операторов образует нормированное кольцо. В нем естествен- 
ным образом определяются натуральные степени оператора и, как следст- 
вие условия мультипликативности операторных норм (8), имеет место 
неравенство 


А" 


<|^“ УпЕ№ 


(по определению считается А ;=/, а из (7) следует |/|=1). Наличие в 
нормированных кольцах степенных операторов позволяет рассматривать в 
них степенные ряды и, в частности, «геометрическую прогрессию» 


ТА А ЗАЙЬ, (9) 


Определение 15. Пусть А — линейный оператор из Х в 
У, а 1х и [у — тождественные операторы в пространствах Х 


и У соответственно. Операторы Г и 0, действующие из У в Х, 
такие, что ГА=1у, АИ =[у, называются соответственно ле- 


вым и правым обратными операторами. Если левый и правый 
обратные операторы одновременно существуют, то они 
совпадают и называются двусторонними обратными или просто 


обратным для А оператором А". 


Существование правого обратного для А оператора означает суще- 
ствование решения операторного уравнения Ах=у без гарантии единст- 


венности, а существование левого — наоборот, обеспечивает единствен- 
ность, но не дает гарантии существования решения. Ясно, что если опера- 


тор А имеет обратный А, то решение х этого уравнения существует, 
единственно и представимо в виде х = РО У. 


Наличие ограниченного обратного оператора А”! для Ав /(Х,У) 


связывают с существованием такой постоянной д > 0, что 
|4%]> 5] УхеХ; 


при этом м | <1б. 
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Один из достаточных признаков обратимости оператора / -— А имеет 
следующую формулировку. 


Теорема 3 (Банаха). Пусть Х — банахово пространство 
и АЕМХ,Х). Тогда, если |А|<4<1, то оператор [-А имеет 
непрерывный обратный оператор (1 =)", являющийся суммой 
ряда (9), причем 


Е 1 
[(- 4) 5 


Наиболее простой и важный для вычислительной математики при- 
мер линейного оператора — это линейное преобразование векторов- 
столбцов х пространства В, в векторы-столбцы у пространства В». 


Каждое такое линейное преобразование у = Ах однозначно определяется 
тх п-матрицей А вида 


ап @12 @ ат 

д. | 9 98 а 
т ’ 

6 ОЕ И 

Чт Что ( Ч тп 


которую можно отождествить с линейным оператором А: А) -> Киш. 


Теорема 4. /Лусть А — линейный оператор из В, в В, ив 
пространствах В, и Е „ введены одинаковые | „-нормы, где р=1, 
р=2 и р=с (норма-сумма, евклидова норма и норма-максимум). 
Тогда Ае [(К,, Кв ), и соответствующие (согласованные и подчи- 
ненные) нормы матрицы А определяются равенствами: 

т 
при р=1 |А| = тах Ув; 
ТЕЪЙ ‚ИУ 1=1 
при р=2 |А|5 =УЛ ‚где Л — наибольшее собственное чис- 


ло матрицы А ТА з 
п 


при р=® ПА. = тах, У. 
«{ЬЙ ‚т} = 
Иногда наряду со спектральной нормой [А применяют другую 
матричную норму, также согласованную с евклидовой нормой вектора, но 
не подчиненную ей, и, как следствие, немультипликативную, — норму 
Фробениуса 


(другие ее названия: евклидова, шуровская, Э. Шмидта). 
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Пусть А — линейное преобразование в пространстве В, и А — 
квадратная матрица этого преобразования. Справедливо неравенство 
[|< А], где А — произвольное собственное число матрицы А,а ||. | — 
произвольная матричная норма. 


5. ФУНКЦИОНАЛЫ И СОПРЯЖЕННЫЕ 
ОПЕРАТОРЫ 


Функционал — это оператор, значениями которого являются веще- 
ственные или комплексные числа. Примерами функционалов могут слу- 
жить определенный интеграл, метрика, норма, скалярное произведение. 

Ограничимся рассмотрением вещественнозначных линейных функ- 
ционалов. Так как они являются частными случаями линейных операто- 
ров, то к ним автоматически могут быть отнесены все результаты, извест- 
ные для линейных операторов. 

Если функционал Г: Х- В, где Х — вещественное нормирован- 
ное пространство, ограниченный, то в соответствии с (7) его норма есть 


|= зир ИС. 
1х =1 


Одним из центральных результатов теории линейных функционалов 
является следующая теорема о продолжении. 


Теорема 5 (Хана-Банаха). Всякий линейный ограниченный 
функционал Г, заданный на подпространстве О нормированного 


пространства Х , можно продолжить на все пространство Х с 
сохранением нормы (т.е. существует определенный на всем про- 


странстве Х такой линейный ограниченный функционал }, что 


Я =Ы“ 7©= 16) УхеР). 


Другой важный результат касается представления линейных функ- 
ционалов и их норм в гильбертовых пространствах. 


Теорема 6 (Рисса). //Лусть в гильбертовом пространстве Н 
задан линейный ограниченный функционал Г. Тогда найдется эле- 


мент уЕН, однозначно определяемый функционалом }, такой, 


что У(х)= (х, у) и |У|=Ы. 


Так, в евклидовом пространстве Ё, п-мерных векторов 
х=(х1,й ‚х„) с вещественными координатами х; любой линейный огра- 


п 
ниченный функционал имеет вид /(х)=(х,с)=Ус,х, с нормой 
= 


= 


п 
Ус? , где с=(с1,й ‚с„) — фиксированный вектор из В„ (свой 
1=1 
для каждого функционала {). Аналогично, в пространстве /.>[а, 6] изме- 
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римых и суммируемых с квадратом на [а,Б] действительных функций 
х(Г) линейный функционал и его норма, соответственно, 


Ь Ь 
кд =ь у) = [дуфе и ИеП, 
а а 
где у(1)е [>[а, Ь] — фиксированная функция. 

Множество линейных ограниченных функционалов, определенных 
на нормированном пространстве Х’, является банаховым пространством 
(независимо от полноты ЛХ’), которое называют сопряженным к Х про- 
странством и обозначают Х *. Вели пространство Х* совпадает с Х ‚ то 
пространство Х называют самосопряженным. 

С помощью понятий линейного функционала и сопряженного про- 
странства в нормированных пространствах вводится понятие сопряжен- 


[А * * * 
ного к линейному оператору А: Х > У оператора А :У —>Х и дока- 
* 
зывается, что [м | = [41| 


р * 
Более просто сопряженный к А оператор А определяется в случае, 
когда А действует из Н в Н , где Н — гильбертово пространство. 


: в г * 
Определение 16. Линейный оператор А называется 
сопряженным к линейному оператору А:Н > Н ‚если 


(Ах, У) = (;, 4*>) Ух, ЕН. 


Определение 17. Линейный ограниченный оператор А назы- 
* 
вается самосопряженным (или эрмитовым), если А = А, т.е. если 
(Ах, у) = (х, Ау) УхуЕН. 


* —1 * 
* * 5:2: * * 
Заметим, что ( ) =А, (4 ) = (4 ') ‚ а операторы А Аи АА — 
самосопряженные неотрицательные операторы (неотрицательность их 
* ® 
понимается в смысле |А Ах, х]>0 и (АА х,х]>0 УхЕН). 
Для самосопряженного оператора А имеет место равенство 


| и | в силу чего условие |А|<1 является не только достаточ- 


ным, но и необходимым для сходимости операторной геометрической 
прогрессии (9). При этом норма самосопряженного оператора А может 
быть представлена через его границы 
тд = Ш (Ах,х) и МА -= зар (Ах, х) 
= ПЕ 
следующим образом: 
[4] = ие х = тах{ид|,|М д. 
х||= 


Как и для матриц, для самосопряженных операторов определяются 
собственные числа и собственные элементы; показывается, что все собст- 
венные числа самосопряженного оператора А вещественны и находятся 
между его границами тд и МА, а соответствующие различным собст- 


венным числам собственные элементы взаимно ортогональны. 
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С неотрицательным самосопряженным оператором А в веществен- 
ном гильбертовом пространстве Н справедливо обобщенное неравенст- 
во Коши-Буняковского 


(Ах, у)? <(Ах,х(Ау, У) УхуеЕН, 


а в случае положительности самосопряженного оператора А (в смысле 
(Ах,х)>0 \Ух=0)иего ограниченности имеет место оценка 


2 
ч\Г <. (Чу, У) УуеН. 

В конечномерном евклидовом пространстве В, , где линейный опе- 

ратор А:®, >В, отождествляется с квадратной матрицей А размерно- 
* 

сти и, роль сопряженного к А оператора А выполняет матрица Ат, 
транспонированная по отношению к А. Следовательно, самосопряжен- 
ными линейными операторами в В, следует считать линейные преобра- 
зования, осуществляемые посредством симметрических матриц, ибо для 
них АТ =А. Свойства таких матриц хорошо известны. 

Если Н — произвольное гильбертово пространство и М — неко- 


торое его подпространство, то оператор Р, ставящий в соответствие каж- 
дому элементу хеН единственный элемент уЕМ (его существование 


обусловлено теоремой 2), называют оператором ортогонального про- 
ектирования или ортопроектором. Этот оператор Р обладает свойст- 
вами РеАН,Н), |Р]=1, Р?=Р иявляется самосопряженным опе- 
ратором. 


6. НЕЛИНЕЙНЫЕ ОПЕРАТОРЫ В 
НОРМИРОВАННЫХ ПРОСТРАНСТВАХ 


В классическом математическом анализе и его приложениях к вы- 
числительной математике многого удается достичь благодаря линеариза- 
ции — замене нелинейных функций близкими линейными. В определен- 
ных случаях такая локальная замена осуществляется с помощью произ- 
водной. Техника линеаризации успешно переносится на нелинейные опе- 
раторы в нормированных пространствах. 

Пусть Е(х) — нелинейный оператор, действующий из банахова 
пространства Х в банахово пространство У, и пусть точка хо принадле- 
жит его области определения 0(Р`) вместе с некоторой окрестностью 5. 


Определение 17. Оператор Е(х) называется дифференци- 
руемым по Фреше в точке хо, если существует такой линейный 
непрерывный оператор Ае ХХ, У), что при любых ЙЕ Х, при ко- 
торых хо +ЙЕб, 


Е(хо +И)- Ехо) = Ай+ @(хо, й), (10) 
где |@(хо, #)]| = (|) при й > 0. Оператор А в представлении (10) 


804 


называется производной (Фреше) и обозначается Е'(хо), а выраже- 
ние Ай = Е'(хо )й = АЕ (хо, #) — дифференциалом (Фреше). 


Производную и дифференциал Фреше называют еще соответственно 
сильной производной и сильным дифференциалом в отличие от также 
существующих слабых поизводной и дифференциала (Гато). 

Если посмотреть на векторную функцию Е(х)= (А (х),й , /„(х)) 
векторного аргумента х=(х|,й ‚х„) как на нелинейный оператор, осу- 
ществляющий отображение точек и-мерного вещественного пространства 
В, в т-мерное вещественное пространство Е „,, нетрудно убедиться, что 
производной Фреше такого оператора служит матрица частных производ- 
ных (матрица Якоби) 


1) „ 2) 

Ох [о 
Е’(х) = (х):= | еее. х 

9»), ды) 


Ох 
В частности, если Ё:В„ —> В, т.е. если Р(х)= ей ‚х„) — функция 
п переменных, то 


гоо-[ 91, й 96 - так. 


› 


[2 бх, 
Таким образом, градиент — это матрица-строка Якоби. 

Производная Фреше нелинейного оператора обладает рядом 
свойств, присущих производным функций одной или нескольких пере- 
менных. Отметим некоторые из них. 

1) Если оператор Е(х) дифференцируем в точке хо, то он непре- 
рывен в ней. 

2) Производная постоянного оператора (например, 1/ где ЛЕВ) 
равна нулю. 

3) Если Е(х)= Ах, где Ае СХ, У), то Е’(х)=А. 

4) Если Е (х) и Е>(х) — дифференцируемые в точке хо операто- 
ры, то при любых о, 4 ЕВ оператор Ё(х):= и Н(х)+ а>Е>(х) диффе- 
ренцируем в этой точке и Ё”(хо ) = Е "(хо) + а2Е"(хо). 

5) Если оператор Р:Х У дифференцируем в точке хоЕХ, а 
оператор О:У > дифференцируем в точке уд = Р(хо)е У, то оператор 
Е =ОР:Х >И дифференцируем в точке хо, причем Е’(хо)= 
=О'(хо)Р' (хо). 

Пусть Е (1), где (=[а,Б] — непрерывная абстрактная функция со 
значениями в банаховом пространстве У. Для нее существует абстракт- 
ный интеграл 


Ь п 
Гкой= ит  УЕ@ар)А, 
а ис К= 

тах 1, >0 
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где Ак = -Ц, 1 — точки разбиения отрезка [а,Б] на и частей, 


а т, — произвольные точки промежутков [11,1% |. Из свойств этого ин- 
теграла выделим три. 


1) Если А — линейный непрерывный оператор, то 
Ь Ь 
Гарда = А Е. 
а а 
2) Если Е (1) = Ф( уд, где Ф(Г) — непрерывная на [а, 6] веществен- 


ная функция, а уд — фиксированный элемент банахова пространства У, 
то 


ь Ь 
ГЕ = хо [Фда. 


Ь Ь 
ГЕО] Пе] 4. 


Через абстрактный интеграл вводится интеграл по отрезку: 


3) 


хо +Ах | 
Го кодах = [Во + Аха Ах; (11) 
х 0 


здесь К(х) — оператор, определенный на выпуклом множестве М бана- 
хова пространства Х’, содержащем отрезок [хо, хо + Ах|, со значениями 
в банаховом пространстве /(Х, У). 
Для непрерывно дифференцируемого оператора имеет место фор- 
мула Ньютона-Лейбница 
хо+Ах 

ГЕ'бдж = ЕС + Ах) - Е). 

№ 
С учетом (11) последняя может быть переписана в виде равенства 


| 
Е(хо + Ах) - Е(хо)= | Е"(хо + ФАх)а® Дх, 
0 
которое называют формулой конечных приращений Лагранжа в инте- 
гральной форме. 
Формулой конечных приращений называют также неравенство 
Ехо +) Ро < зир "(хо + ФАЗА, 
9е(0, 1) 
а неравенство 
[Е (хо + Ах) - Ес )- Е" (хо )Ах] [Ах] - зир |Е"(хо + 9Ах)- Е" (хо 
©9е(0,1) 
носит название формула конечных приращений с остаточным членом. 
Предположим, что нелинейный оператор ЁЕ(х): Х ->У дифферен- 
цируем во всех точках хе Х. Тогда при каждом фиксированном х опера- 
тор Ё’(х): Х > КХ,У) линеен. Если же х считать переменным элемен- 


том Х, то Е’(х), вообще говоря, — нелинейный оператор, и для него 
можно вновь ставить вопрос о дифференцировании. Таким образом, при- 
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ходим к понятию второй производной оператора Е(х), каковой считаем 
оператор 
Е"(х) = (Е'(х)/: Х- ЦХ, ЦХ,У)). 
Вторая производная является представителем билинейных операторов. 


Определение 18. Оператор В, ставящий паре элементов 
х, ХЕХ элемент у= В(х,Х)еУ, называется билинейным, если 


он линеен по каждому из аргументов, т.е. 
В(ох1 + @2х2,Х)=оиВ(>, х) + а В(х>, &), 
В(х, В + Вох›)= Ви В(х, м) + В>В(х, х ), 
и ограничен в совокупности, т.е. 
[9 СЫНЕ УххеХ 
(наименьшая из таких постоянных С > 0 называется нормой били- 
нейного оператора В). 


Множество билинейных операторов, действующих из нормирован- 
ного пространства ЛХ’ в банахово пространство У, образует банахово про- 


странство ДХ ТЬ изометричное пространству [(Х, [(Х, У)). Следова- 
тельно, Е”(х)е Цх?, у), причем Е”(х)йй = Е”(х)й?. 

Обращаясь к примеру т-мерной векторной функции Е(х) вектор- 
ного и-мерного аргумента х, нетрудно выяснить, что ее вторая произ- 
водная есть отображение пространства В, хВ, в В», и результат такого 
отображения — 7т-мерный вектор Е"(х)в® при произвольных В и © из 
В, имеет представление 

" т т 
Е”бкдвя = (ЕТ ни бов,й „вТН„(хв), 


, 


где Н ;(х) — матрица Гессе, вид которой 
9? 7,(х) 92 1,(х) з 9? 7, (х) 
д? дб, дб 
Н (= еее. | 
и б7® , 978) 
бх,бх — Ох,дхо дх„2 
Подобно билинейным операторам и вторым производным вводятся 


полилинейные операторы и производные А-го порядка К ) (х)е Г Ж#, у 
при КЕМ. Наличие у нелинейного оператора Ё(х) производных до 
(К + 1)-го порядка позволяет записать для него формулу Тейлора 


Е) = Е += Е) + Ев +" и? +1 


1 -(% в, 1” бы р 
ВР (м +— | РИ х-, 
К К 
хо 
где последнее слагаемое — одна из форм представления остаточного чле- 
на (через интеграл по отрезку). 
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ПРИЛОЖЕНИЕ 2 
ОБРАЗЦЫ ПОСТАНОВОК _ 
ЛАБОРАТОРНЫХ ЗАДАНИИ 
Лабораторная работа 1. «Метод Гаусса и ГО-разложение матриц» 


Дана система Ах =, где: 


вариант 1 14 -8 —21 12 19 
10 —6 -15 9 14 
А = ‚ = $ 
35 =20 56 .32 53 
25 -15 -40 24 39 
вариант 2 10 -3 -9 И 
О1 -7 —-21 22 
А = з Ъ = 5 
3 12 -92 -279 297 
14 -31 -94 100 
и т.д. 


1. Решить систему методом Гаусса. Предусмотреть постолбцовый 
выбор главного элемента и итерационное уточнение решения до достиже- 


ния точности = = 10`'? по евклидовой норме невязки в рамках применяе- 


мой схемы реализации метода 


2. Выполнить [О-разложение матрицы А и с его помощью полу- 
чить де А и решение х данной системы. 


3. Найти матрицу Х = А-! двумя способами: 
а) решая подсистемы Ах/ =е/” системы АХ =Е (используя при 
этом фрагменты выполнения п.1); 
6) применяя готовые формулы, полученные на основе ГО -разло- 
жения. 
4. Вычислить соп@ А в различных простых нормах и охарактеризо- 
вать чувствительность данной системы к погрешностям исходных дан- 
ных. 


* 
) Лучше взять = =10. тазйеру ‚ предварительно найдя тазйерх ис- 
пользуемого компьютера. 
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Лабораторная работа 2. «Метод прогонки» 


Методом прогонки найти вектор (м1; и2; й ; шо), являющийся 
решением уравнения (системы) 


аки к + ких + Скидка = ЛЬ, 


где А=12,й ‚10; а=со =0; коэффициенты ах (при К=2,3,й ,10), 
Ь; (при А=12,й ,10), су (при К=1,2,й ‚9)и Л (при К=Ъ2,й ,10) 
задаются следующей таблицей: 
орал 
21? +72 +2 
2 +3 +2 


Что можно сказать об устойчивости прогонки в данном конкретном 
случае? 


Лабораторная работа 3. «Прямое и итерационное решение сим- 
метричной линейной алгебраической системы» 


С точностью ==10`!? найти решение системы 
6 
Уаих,=Ь;  (@=Ь2,й ,6) 
2: 


с матрицей коэффициентов вида 
р ОЛ 0 0 4 0 
01р1 [2 0/1 0 0 4 
0 0 
0 


А = (“,) 3 0.1р> Рз 0.1 рз 


= © э © 
> 
> - 
9 
> 

ег 2 

р -ч 

‹ > 
А 
> 
> 

5 

л 

ыыы ыы" 


если: 


Грета о [ыбтгаи, 
т 
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Применить: 


а) метод квадратных корней; 

6) метод Якоби (сделав предварительно подсчет числа итераций, га- 
рантирующего получение решения с заданной точностью); 

в) метод Зейделя; 

г) метод сопряженных градиентов. 


Попытаться уменьшить число итераций метода Зейделя, вводя релак- 
сационный параметр и оптимизируя его значение экспериментальным путем. 
Провести сравнительный анализ примененных методов. 


Лабораторная работа 4. «Численное решение алгебраических 
проблем собственных значений» 


Дана матрица: 


вариант 1 7-1-2 3 вариант 2 52 0-1 
= $ 02. 2 1 1| 
-2 0 51" 0-3 9 47 
3$ м 17 1148 
и т.о. 


1. Найти наибольшее по модулю собственное число и соответст- 
вующий ему собственный вектор 
а) степенным методом; 


6) методом скалярных произведений. 
(В качестве начального взять вектор (1; 1; 1; 1) ). 


2. Найти наименьшее по модулю собственное число и соответст- 
вующий ему собственный вектор 

а) методом обратных итераций; 

6) методом обратных итераций с отношениями Рэлея. 


3. Решить полную проблему собственных значений методом враще- 
ний Якоби. 


Точность = = 10-6 (в евклидовой норме). 

Лабораторная работа 5. «Методы решения скалярных уравне- 
ний» 

С точностью ==10"? найти каждый из корней уравнения: 


вариант 1 4х? х-4.Л+х+5=0; 
вариант? х\е“+3х-1-2=0; 


и т.д. 
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каждым из следующих способов: 


1) методом половинного деления; 

2) методом хорд; 

3) методом Ньютона; 

4) методом секущих; 

5) полюсным методом Ньютона (с подвижным полюсом); 
6) полюсным методом секущих. 


Сравнить методы по числу итераций и по вычислительным затра- 
там. Что можно сказать об эффективности примененных методов? 


Лабораторная работа 6. «Скалярная задача о неподвижной 


точке». Е, 
С точностью &=10 решить уравнение: 


вариант 1 ё-145* 3 =0: 
вариант 2 (*-4) +Шх=0; 


и т.о. 
а) методом простых итераций; 


6) А? -процессом Эйткена; 

в) методом Вегстейна. 

Предварительно привести уравнение к виду, пригодному для прове- 
дения итераций; доказать существование и единственность корня; выбрав 
начальное приближение, сделать априорную оценку количества шагов ме- 
тода простых итераций. 

Результаты представить по следующей форме: 


Метод Начальное Априорное Фактическое Получен- Невязка 
приближение | число итераций | число итераций | ный корень 

[Эйткена | 

Вегстейн | 


а (Сравнить методы по требуемому количеству вычислений функций 
для получения решения с заданной точностью. 


Лабораторная работа 7. «Метод Бернулли вычисления корней 
многочлена» 


Дано уравнение: 
вариант1 х“ +11х3 —11.51х2 -2331х-0117=0; 
вариант? х“-—103х3 —15/75х2 — 286.875х —84375=0; 
и т.д. 


1. Непосредственным применением метода Бернулли найти наи- 
больший и наименьший по модулю корни. 
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2. Используя найденные корни, понизить по схеме Горнера степень 
многочлена и найти остальные корни. 


Лабораторная работа 8. «Решение систем нелинейных уравнений» 


Дана система и начальная точка: 


вариант 1 (ху) -8(@+у)=0, х0 =2, 
2(х- у) +15 ШС +у)-5=0, У =-0.5; 


вариант? — |(.8х? +2ху+1.3у? +20х-15у=0, хо =0.5, 


е0.65-0.8х _| 14х—1.52у=0, 20 =1; 
и т.д. 


Найти решение данной системы, исходя из данной начальной точки, 
следующими методами: 


1) основным методом Ньютона (явным или неявным); 

2) разностным методом Ньютона (с разными шагами дискретизации 
производной); 

3) модифицированным (упрощенным) методом Ньютона; 

4) методом Ньютона с аппроксимацией обратных матриц; 

5) методом Брауна; 

6) методом секущих Бройдена; 

7) методом градиентного спуска. 

Провести сравнение всех указанных методов решения нелинейных 
систем на основе конкретного вычислительного материала, полученного 
при задании точности &= 10-3, 10-6 ь 0-®. 


Лабораторная работа 9. «Интерполяция» 


Многократно дифференцируемая функция /(х) задана табли- 
цей значений у; = Х (х,): 


ВЕ реови [14855 роза [54а 1.8107 |2.1509 |2.5775 


Го [©2из 0.4108 |0.6367 |0.8881 |1.1752 |1.5095 |1.9043 |2.3756 


(где последние цифры являются продуктами правильного округления), и 
заданы контрольные значения аргумента 


х=0.25,. х=0:92 и х=163. 
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А) Записать подходящее для приближенного вычисления значений 
у=/(х), 2=/1(%), ›= Г() конкретные интерполяционные многочле- 
ны Лагранжа первой и второй степени и получить эти значения. 

Б) Составить алгоритм, реализующий схему Эйткена вычисления с 
максимально возможной точностью значения /(х) в произвольной точке 
х промежутка [хо,х„ +(х„ -х„_1)|. Пользуясь этим алгоритмом, вычис- 
лить приближенные значения у, у и у. 

В) Составить таблицу конечных разностей, записать оптимальные 
для вычисления у, У и } конкретные конечноразностные формулы и с 
их помощью получить эти значения. 


Проанализировать результаты выполнения заданий А-В. 


Лабораторная работа 10. «Аппроксимация таблично заданных 
функций» 


Функция /(х) задана следующей таблицей значений у, = Х(х; ): 


о ррррререр 
[тт [2 а [т о [42 ва [в [428 


р а [аа ра ам [а 


Г. Е наименьших квадратов аппроксимировать /(х): 


а) линейной функцией; 
6) многочленами Фурье второй, третьей и четвертой степеней; 


в) функцией вида а15(5х); 
Ь. 


Бх 


г) функцией вида ах 
д) функцией вида ае 


Сравнить величины среднеквадратических отклонений. Пользуясь каждой 
из найденных функций а-д, вычислить контрольное приближенное значе- 


ние (35). 


2. А) Для функции 1() построить интерполяционный кубиче- 
ский сплайн дефекта 1 и с его помощью вычислить приближенно /(35), 


40 
1'(35) и [7(кк. 
10 
Б) Представить построенный сплайн линейной комбинацией куби- 
ческих В-сплайнов (конкретизировать вид этих В-сплайнов соответст- 


венно рассматриваемому случаю и найти коэффициенты их линейной ком- 
бинации). 
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Лабораторная работа 11. «Численное интегрирование» 


Даны интегралы: 
2 4 
1 (4 +х) №8 
вариант! 1 = | -е 003% Ь =] ыы 


04% | (4-х) /х 


вариант 2 Е? Г Г 5: ей 
н =, = ; 
г 06х+510.5х ь о\х\2-х 


и т.д. 

1. Сколько достаточно взять узлов, чтобы найти значение инте- 
грала /| с точностью =5 =1073: 

а) по формулам прямоугольников (средней точки) ? 

6) по формулам трапеций ? 
Вычислить /| по этим формулам с данной точностью. 


2. Вычислить /| по формуле Симпсона с девятью узлами и по 
формуле Гаусса с четырьмя узлами. 


3. С точностью #1 =10`8 найти значение интеграла /| алгоритмом 


Ромберга, стараясь минимизировать количество вычислений подынте- 
гральной функции. 


Сравнить результаты пунктов 1-3. 


4. Подбирая подходящие методы вычисления определенных и не- 
собственных интегралов, с точностью => = 10-4 найти значение [5 не ме- 


нее, чем двумя способами. 
Лабораторная работа 12. «Численное дифференцирование» 


Бесконечно гладкая функция Л(<) задана несколькими своими ок- 
ругленными значениями у;: 


Гео роза о [оз [7959 [05 


Гон оз олен оз лан лаз зв 


1. Создать аналогичную таблицу с приближенными значениями 
функции /’(х), находимыми по формулам: 


а) первого порядка точности, 
6) второго порядка точности, 


оставляя в результатах верные цифры и один запасной десятичный знак. 
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2. Создать таблицу приближенных значений функции /”(х), под- 
считываемых по формуле второго порядка точности. 


3. Максимально точно, насколько это можно в данных условиях, 
вычислить значения 


1(025), Г(0.55), /"(025) и (0.55). 
Лабораторная работа 13. «Численное решение дифференциаль- 
ных уравнений первого порядка» 
Дано дифференциальное уравнение и начальное условие: 


2 2 3 
3 — 
вариант 1 = №. Вы. У(0)=1; 


) 


2\1+х3 с0$(1) 


ь 2хе\у 
вариант 2 У = (2) 5(0)=0; 
+х ]е 


и т.о. 


1. Заполнить таблицу 


о Го оз о Го Го от ая [в т. 


Г О О О В Е В О А КВ А ВУ 


приближенными значениями решения данной задачи Коши, вычисленны- 


ми с точностью &=10`8 методом Рунге-Кутты с автоматическим выбо- 
ром шага или методом Кутты-Мерсона (указать окончательный расчет- 
ный шаг в каждой точке таблицы). 

2. Взяв из таблицы п.1 первые четыре значения решения, продолжить 
вычисления до точки х=1 с фиксированным шагом й = 0.1 методом Мил- 
на и предиктор-корректорным методом Адамса четвертого порядка. Под- 
считать главные части получаемых при этом на каждом шаге погрешно- 
стей. 


Лабораторная работа 14. «Численное решение задачи Коши 
для обыкновенного дифференциального уравнения второго порядка» 


Дана задача Коши: 


вариант 1 =, (1)=1, У()=0.5; 
4\/2х? 
у? -—х 

вариант 2 ЕН, У(1=2, У()=1Г; 
2\/3х2 

и т.д. 
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На отрезке [1,2] построить таблицу значений ее решения у(х) с ша- 
гом И = 0.1 и заданной точностью = = 15, применяя: 


а) сведение к системе дифференциальных уравнений первого по- 
рядка с последующим численным интегрированием ее методом Рунге- 
Кутты или Кутты-Мерсона: 


6) предиктор-корректорные методы Адамса непосредственно к дан- 
ной задаче (несколько первых «разгонных» значений можно взять из про- 
межуточных результатов п.а)). 


Указать окончательный расчетный шаг, обеспечивающий заданную 
точность в каждом случае. 

Лабораторная работа 15. «Численное решение линейной крае- 
вой задачи» 


Дана краевая задача: 


3 3 

вариант у" =,  оЛ)+0лУЛ)=-, 350; 
хх д 
. 4х+7 1 

вариант 2 а И 1 >(2)=2, 


х+2 4(х+2)' ^ Мх+2 | 
5(2.3) = 8.6у'(2.3); 
и т.д. 


На промежутке, определяемом данными краевыми условиями: 


1. с точностью = =10-6 построить каркас решения у(х) на сетке с 
шагом Йо =0.1 конечноразностным методом второго порядка и противо- 
потоковым методом (указать шаг расчетной сетки, при котором обеспечи- 
вается эта точность в каждом методе); 

2. применить методы Галёркина и коллокации с тремя-четырьмя 
базисными функциями; 


3. решить краевую задачу путём сведения ее к задаче Коши (мето- 
дом редукции или дифференциальной прогонки). 


Результаты пп. 2, 3 сравнить с результатами п. 1 (дать сводную таб- 
лицу значений приближенных решений на сетке с шагом йо). 


Лабораторная работа 16. «Квадратурный метод решения инте- 
гральных уравнений» 


Для уравнений 


2 
х(и) = [О(, 5)х(5)6 + 1) (1) 
0 
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1 
[К(, 5х5) = Е(@) (2) 
1 
заданы ядра и свободные члены: 
1 
вариант 1 О(Ь $) =2ш—, @=Р —1#+1; 
1+2 
К, 5) =1+\5, Е = -1-1; 
2 
вариант 2 0(, 5) =1+ш(+5), ЛО=1-— 
+ 
У 
ке“. Е(О= 3-21; 
5 
и т.д. 


1. На сетке точек /; отрезка [0, 2] с шагом сетки И; = 0.5 построить 


каркас приближенного решения уравнения (1) с точностью ==10%, 
пользуясь какой-либо квадратурной формулой замкнутого типа и приме- 
няя сгущающиеся расчетные сетки для обеспечения заданной точности. 
На основе полученного каркаса записать приближенное решение в виде 
непрерывной функции и с ее помощью вычислить приближенные значе- 


1-е 


2. Применяя квадратурную формулу прямоугольников на отрезке 
П,2] с шагом #5 =0.2, найти каркас приближенного решения уравнения 


(2) с точностью ==103. Представить полученное дискретное решение 
интерполяционным многочленом третьей степени, построенным по пер- 
вым четырем узлам заданной сетки, и, пользуясь этим, вычислить при- 
о 2 
ближенно х| — | их — |. 
5 9 


Лабораторная работа 17. «Численное решение смешанной за- 
дачи для параболического уравнения методом конечных разностей» 


Дана начально-граничная задача для неоднородного уравнения теп- 
лопроводности: 
2 
ди 0^и х+1 
вариант1 —=4—+Ш——, хЕ[0,|, 1Е[0,Т]; 
9 ах? 1+1 


1 
и(х, 0) =—; и(0, 2) = с0$ Е, и 1) =0.5; Т = 0.3; 
х+1 
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ди д2 
вариант 2 9. =025— + +", ХЕЮЛ, ЕР 
1 


Ох 
и(х, 0) = агсюх; и(0,0)=0, иьо= (2-1 в Т=2: 


ит.д. 


Решить ее методом конечных разностей, обеспечивая точность 
= =0.01 в узлах сетки с шагом й=0.2 с помощью правила Рунге. Срав- 
нить требуемый для этого объем вычислений при использовании следую- 
щих двухслойных разностных схем: 

а) явной четырехточечной; 

6) неявной четырехточечной; 

в) схемы Кранка-Николсон. 


Лабораторная работа 18. «Конечноразностное решение сме- 
шанной задачи для гиперболического уравнения» 


Дана задача: 


2 2 
вариант 1 би ом, х=[0, |, 1=[0,Т]; 
[6.1 ох 
ди(х,0 
и(х, 0) =х; С У, и(0, = агсюи,  ШЬЕТ; 


2 
вариант 2 ИИ хЕ[ 0, |, 1Е[0,Т]; 
[@]} бх 


и(х, 0) =\1- —- Че ар чб и 


ит.д. 


Для значения Т = 0.5 получить ее численное решение на сетке с ша- 
гом й= 0.2 по переменной х, применяя явную разностную схему второго 
порядка. Для вычисления значений первого слоя использовать как про- 


ди 
стейшую несимметричную аппроксимацию Е в начальном условии, так 
1 
и метод фиктивной точки. 


Лабораторная работа 19. «Метод переменных направлений 
решения двумерной задачи теплопроводности» 


Применяя продольно-поперечную прогонку, найти каркас прибли- 
женного решения задачи 


2 
РЕ В Де, (х, уу еЕОх[0,Т]}; 
0х? ду? 


и(х, у, 0) = ф(х, у), (хуУеЕО; 
и(х, у.) =(х, у,1), (%у)ЕГо 
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(где область О и функции Х, ф, / определены ниже) на квадратной сетке 
с шагом й= 0.25 при Т =0.1. Провести расчеты со следующими значе- 
ниями шага т по времени /: 


Г Т 
а) т=Т; б)т=-—; вт=-; дт=- 
2 4 


вариант 1 ь 

оу, =х2 + УЕ, 

ф(х, у) =1, 

убив = ее” 

0 2’ 56 

вариант 2 У 

съ у) =@+Р)зтлу, Г |=--- 

ф(х, у)=0, 

их, у, г) = 1 + худ; а т _ >, 
и т.д 


Лабораторная работа 20. «Конечноразностное решение задачи 
Дирихле для уравнения Пуассона» 


Получить каркас приближенного решения заданной ниже гранич- 
ной задачи на квадратной сетке с шагом й=0.2 с точностью = = 0.01 
(расчетный шаг устанавливается по правилу Рунге). Применить: 

1) метод конечных разностей с решением систем сеточных уравне- 
ний: а) методом Гаусса; 6) методами Зейделя и ПВР (с эмпирической 
оптимизацией параметра релаксации); 

2) итерационный метод переменных направлений (с нулевым на- 
чальным приближением). 


2 2 

вариант 1 би один? = 0, (х;у)ЕО, 
&х° д [6 
О={(х; У] х>у х+у<2, у>0}, 
Чт. =0; 

вариант 2 Ри 02+ {= 0, (ху)ЕО, 
а? ду? 


О ={(%; У] у>х, х+у<2, х>0}, 
Чг.=0; 


и т.д. 
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ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 


Аддитивное выделение особенно- 
стей 505 


Алгебраический порядок точности 
489, 572 


Алгоритм Вегстейна 263 

— гибридный 226 

— минимальной степени 771 

— МСГ 119 

— прямоугольников-трапеций 485 
— Ромберга 486 

— численно устойчивый 28 


Аналоговая вычислительная маши- 
на 534 


Апостериорный контроль глобаль- 
ной погрешности 555 


Аппроксимационный аналог метода 
Ньютона 289 


Аппроксимация 328 

— кусочно-полиномиальная 329, 431 
— полиномиальная 329 

Аффинная модель 294 


Базисный многочлен Лагранжа 333 
Бифуркация решений 268 


Ведущий элемент 58 
Вековой определитель 137 
Вес (весовой коэффициент) 487, 738 


Вторая интерполяционная формула 
Гаусса 358 


— — —_ Ньютона 356 


Второй интерполяционный много- 
член Ньютона 355 


Главный элемент 58 
Глобальная погрешность 471 
Горнер 225 

Градиент 805 

Граница погрешности 13 


Границы самосопряженного опера- 
тора 803 


Граничная полоска 764 


Двумерный полюсный метод Нью- 
тона 304 


Декомпозиция 64 

Дефект сплайна 437 

Диагональное преобладание 65, 100 
Диаграмма Фрезера 363 

Диапазон машинных чисел 20 
Дивергентный вид уравнения 744 
Дискриминант 692 

Дифференциал Фреше 805 
Дифференцируемость по Фреше 804 


Жесткая система 609 
— — на интервале 609 


Единица объема информационного 
запроса 225 


Задача Абеля 655 

— граничная 694 

— Дирихле 695 

— интерполяции 332 

— корректная 39, 694 

— краевая 618, 619, 695, 696 

— на собственные значения 135 

— начальная (Коши) 533, 694 

— начально-граничная (смешанная) 
694, 695, 696 

— Неймана 695 

— некорректная 39, 528, 658 

— неустойчивая 27 

— о неподвижной точке 244, 283 

— обратного интерполирования 371 

— регуляризуемая 47 

— условно корректная 46 

Запятая фиксированная 19 

— плавающая 20 

Зацикливание 268 

Звено сплайна 445 


Интеграл абстрактный 805 
— Дирихле 718 
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Интеграл по отрезку 806 

Интегральное уравнение 535, 655 

— — линейное 656 

— — нелинейное Вольтерра 687 

Интерполирование 331 

Интерполяционная 
формула 497 

— схема Эйткена 342 

— формула Бесселя 358 

— — Ньютона для неравноотстоя- 
щих узлов 369 

— — Стирлинга 358 

Интерполяционный метод Адамса-— 
Моултона 564 

Интерполяция 331 

Исчерпывающий спуск 308 

Итерационная функция 255 

Итерационный параметр 785 

— процесс двухступенчатый 288 

— — квадратично сходящийся 201 

— — нестационарный 111, 255 

— — первого порядка 201 

— — стационарный 111 

— — Эйткена-Стеффенсена 256 

Итерированный вектор 142 


квадратурная 


Каркас приближенного решения 588, 
664, 730 


— резольвенты 681 

Квадратура Лобатто 494 

— механическая 466 
Квадратурная формула 466 

— — Гаусса 490 

— — Гаусса-Кристоффеля 495 

— — замкнутого типа 494 

— — интерполяционного типа 497 
— — Лагерра 500 

— — левых прямоугольников 467 
— — Маркова 494 

— — Мелера 499 

— — Ньютона-Котеса 472 

— — открытого типа 494 

— — правых прямоугольников 467 
— — средних прямоугольников 468 
— — типа Гаусса 495 

— — Чебышева 489 


830 


Квадратурная формула Чебышева- 
Лагерра 500 


— — Эйлера 495 

— — — составная 495 

— — Эрмита 498, 500 

Квадрирование корней 277 

Ключевой элемент 165 

Компактная схема Гаусса 66 

Конечноразностная формула чис- 
ленного дифференцирования 511 

Конечные разности 257, 346 

— — многочлена 348 

— — практически постоянные 352 

Конечный элемент 652, 721 

Константа Липшица 247 

Координатный элемент 713 

Координаты барицентрические 725 

Корневое условие 602 

Коэффициент Котеса 472 

— сжатия 247 

— схемы Горнера 273 

— Фурье 416 

— чувствительности 37 

Краевые условия 75, 619 

Кратность узла 376 

Критерий согласия 329 

— Чебышева 394 


Лагранжев элемент 724 
Лемма Неймана 92 


Линейное интегральное уравнение 
второго рода Вольтерра 657 


м Фредгольма 657 

— — — первого рода Вольтерра 658 
——_—_— Фредгольма 658 

— — — третьего рода 659 


— разностное уравнение с пос- 
тоянными коэффициентами 595 


Линейный фильтр 436 


Линейных многошаговых методов 
общий вид 571 


Локальная ошибка дискретизации 
735 


Мантисса 20 
Марш-алгоритм 775 


Масштабирование 58 Метод дифференциальной прогонки 
Математическая физика 688 625 


Матрица Гессе 807 — дифференцирования назад 615 
— Гильберта 31, 417 — дихотомии (вилки, проб) 197 
— жесткости 725 — дробных шагов 755 

— итерирования (перехода) 100 — замены ядра на вырожденное 662 
— отражения (Хаусхолдера) 178 — Зейделя 102, 777 

— плоских вращений 162 — — симметричный 779 

— простой структуры 141 — интегро-интерполяционный 


(баланса) 744 
— итерационный 53 
— — двухслойный 117 


— с диагональным преобладанием 65 
— сопровождающая 137 
— Хессенберга (правая почти тре- 


угольная) 178 — — трехслойный 118 
— Якоби 805 — — фон Мизеса 143 
Машинная бесконечность 21 — касательных 204 
Машинное слово 21 — квадратных корней 74 
Машинный нуль 21 — квадратурный (конечных сумм) 
— эпсилон 21 662, 663, 669 


— квазиньютоновский 310 
— коллокации (совпадений, интер- 
поляционный) 632, 702 
м = — конечных разностей (МКР) 626, 727 
— А-устойчивый 610 МКЭ) 642_722 
— А(м)-устойчивый 614 — Чи Фары, 
— Коуэлла четвертого порядка 576 


Мера аппроксимации 588 
— обусловленности 29, 418 
Метод абсолютно устойчивый 599 


— Берну НИ 278 — Кутты-Мерсона 554 

— бисекций 185, 197 — Лагранжа (Маклорена) 275 
ыы - — Либмана 778 

— Брау на 294 — Лина (предпоследнего остатка) 
— Бройдена 298 274 

— вариационного типа 118, 711 — линеаризации 204 

— вариационно-сеточный 722 — Лобачевского  (Лобачевского- 
— Вегстейна 261 Греффе, Данделена) 277 

— Вестерфильда 276 — локально-одномерный 756 

— вложенных форм 554 — матричной прогонки 775 

— вращений 82 — Милна 568 

— — Якоби 163 — — второго порядка 543 

— второго порядка 207 — минимальных невязок 123 

— Галёркина 638 — моментов 662 

— Гаусса 57 — наименьших квадратов (МНК) 
— Гаусса-Зейделя 105 406, 711 

— главных элементов 59 — наискорейшего спуска 308 

— Горнера 274 — Некрасова 105 

— градиентный 308 — нестационарный 117 

ры графический 534 — неустойчивый 27 

— двухшаговый 118, 222, 543 — неявный 117 

— двухэтапный 549 — нижней релаксации 113 
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Метод Нистрёма второго порядка 543 Метод проекционный 637 


— Ньютона 204, 286 — простых итераций 92, 244, 283 

— — модифицированный (упрощен- — противопотоковый (ир\йпа) 631 
ный) 219, 254, 288 — прямого поиска 311 

— — огрубленный 219 — прямой 52 

— — полюсный 229, 304 — прямых 701 

— — разностный (конечноразност- — разделения переменных (Фурье) 
ный, дискретный) 220, 290 696 

— — с параметром 217 — расщепления 118, 755 

— — с подвижным полюсом 232 — редукции 622 

— —_с последовательной аппрок- — регуляризации 47 


симацией обратных матриц 289 — рекурсивный 288 
— Ньютона-Канторовича 313 — релаксации 111 
— Ньютона-Рафсона 204 — Ритца 642, 713 
— Ньютона-—Шрёдера 217 


6 и ее — Ричардсона 117 
г ш линейной интерполя- __рунге_Кутты 546 


— — — четвертого порядка 549 

———_—__— пятиэтапный 554 
— сзабеганием вперед 576 

— секущих 222, 290, 310 

— — Бройдена 297 

— — полюсный 230 

— скалярных произведений 148 


— обратный степенной 155 

— обратных итераций 155 

— одновременных смещений 102 
— отражений 181 

— переменной метрики (ДФП) 310 
— переменных направлений 118, 755 
— — — итерационный 783 


— але. 936 — сопряженных градиентов 119, 
310 
— Писмэна-Рэчфорда 755 — спуска 308 
— плоскостей (гиперплоскостей) 701 __ средней точки 548 
—_ покоординатного расщепления стационарный 117 
755 


— степенной 143 


— покоординатных итераций 285 
— степенных рядов 534 


— полной релаксации 111 


— половинного деления 197 =. Стеффенсена 221 
— полудискретный 704 — ны аппроксимации 756 
$ — точный 
ПНменНЯ треугольный 118, отранелийьй Я, 384. 50 
— последовательной верхней ре- —^ Условно устойчивый 598 
лаксации 113 — установления 116, 782 
— последовательных приближений — фиктивной точки 742, 767 
244, 283, 536, 662 — характеристик 748 
— — смещений 102 — Хойна (Хьюна) 542, 548 
— пристрелки (стрельбы) 622 — хорд (пропорциональных частей, 
— прогноза и коррекции (предска- линейной интерполяции) 199, 
зания и уточнения) 565 254, 372 
— прогонки 76, 442 — частных Рэлея 149 
— продольно-поперечный 784 — четырехэтапный 549 
— проекционно-разностный (проек- —— чисто неявный 615 
ционно-сеточный) 642, 722 — Шульца (Бодвига) 127 
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Метод Шульца зейделева модифи- 
кация 128 


— Штёрмера 583 
— Эйлера (ломаных) 538, 562, 573 
— — исправленный 546 


— — неявный (обратный) 541, 564, 
573 


— — с пересчетом 542 
— — уточненный 543 
— — явно-неявный 565 
— энергетический 712 
— явный 116 


— — итерационный с чебышевским 
набором параметров 118 


— Якоби 99, 776 

— — циклический с барьерами 168 

— а-регуляризации Тихонова 47, 
67 


Метрика (расстояние) 790 

— евклидова 792 

— равномерная (чебышевская) 792 
Многочлен возмущенный 26 

— Лагерра 422 

— Лагранжа интерполяционный 333 
— Лежандра 420 


— наилучшего равномерного 
приближения 394 


— Чебышева 384 

— — второго рода 421 

— — нормированный 386 

— — первого рода 421 

— — смещенный 389 

— Эрмита 422 

— — интерполяционный 376 
— Якоби 421 

Многошаговый метод Адамса 560 
Множество всюду плотное 791 
— корректности 46 
Модельное уравнение 597 
Модификация Ингленда 555 
— Фельберга 555 


Мультипликативное выделение 
особенностей 504 


Наилучшая равномерная оценка 
погрешности интерполяции 391 


Направление минимизации 307 
— спуска 308 
Невязка 33, 85, 124, 207, 290 


Непрерывный аналог итерационно- 
го метода 116 


Неравенство 
796 


— — — обобщенное 804 

— Коши-—Шварца 797 

Норма 793 

— Гёльдера 795 

— евклидова 795, 801 

— оператора 799 

— спектральная 801 

— Фробениуса 166, 801 

— чебышевская 393 

— шуровская, Э/Шмидта 801 
— энергетичская 713 
Норма-максимум 795 
Норма-сумма 795 

Нормальная система МНК 414 
Нормальное псевдорешение 43, 406 


Коши-Буняковского 


Область устойчивости 610 

Обобщенный многочлен 413 

— — наилучшего среднеквадрати- 
ческого приближения 413 

— — Фурье 416 


Обратная задача теории погрешно- 
стей 16 


Обратные итерации 154 

— — со сдвигами 155 

— — с отношениями Рэлея 158 

— — с переменными сдвигами 157 
Обратный ход 57 

Обреченный элемент 166 

а формула прямоугольников 


Однопараметрический полюсный 


метод Ньютона 235 
Округление правильное 20 
Оператор 798 
— аддитивный 799 
— билинейный 807 
— восполнения 587 
— дистрибутивный 799 
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Оператор Лапласа 689 

— линейный 799 

— неотрицательный 803 

— непрерывный 799 

— обратный 800 

— ограниченный 799 

— однородный 799 

— ортогонального проектирования 
804 

— регуляризирующий 46 

— самосопряженный 803 

— сноса 587 

— сопряженный 803 

Определитель Фредгольма 660 

Оптимальный шаг численного 
дифференцирования 526 

Ординатный вид формулы 561 

Ортогональность с весом 421 

— элементов 797 

Ортопроектор 804 

Основание вещественного числа 20 

Осреднение по трем точкам 436 

Остаточный член интерполяцион- 
ной формулы 336 

— — — — Эрмита 381 

— — простейшей формулы прямо- 
угольников 469 

— — — —_ Симпсона 474 

— — —_ —_ трапеций 473 

— — формулы Симпсона 480 

— — — трапеций 479 

Отношение Рэлея 139 

Отрезок тригонометрического ряда 
Фурье 416 

Оценка погрешности 13 

— — апостериорная 94 

— — априорная 94 

Ошибка 207 

— глобальная 539 

— локальная (шаговая) 539 


Параметр регуляризации 47, 668 
— релаксации 111, 778 
ПВР-метод 113 

— блочный 779 


Первая интерполяционная формула 
Гаусса 357 


— — — Ньютона 354 
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Первый интерполяционный много- 
член Ньютона 353 

Погрешность абсолютная 13 

— — безусловная 35 

— задачи 12 

— метода 12 

— неустранимая 12 

— округлений 12 

— относительная 13 

— полная 13 

— условная 36 

— устранимая 12 

— шаговая 546 


Полная проблема собственных зна- 
чений 135 


Полнота по энергии 713 
Полюс 228, 304 


Полюсно-бесполюсный метод Нью- 
тона 237 


Порядок аппроксимации 588 
— вещественного числа 20 
Последовательность Рэлея 159 
— фундаментальная 790 
Постоянная Фейгенбаума 270 
Поправка 85, 207, 286, 302, 305 
— Ричардсона 483, 552 

— — обобщенная 485 

— шаговая 549 

Правило ложного положения 200 
— Ньютона 36 


— — вычисления арифметических 
корней 214 

— Чеботарёва 17 

Предел 790 

Предиктор-корректорный метод 565 

— — — Адамса 565 

Преобразование отражения (Хаус- 
холдера) 178 

— плоских вращений Гивенса 181 

— подобия 161 

Приближение 328 


— наилучшее — среднеквадратиче- 
ское 413, 426 


— чебышевское 394 
Приближенное решение 588 
Прием Гарвика 152 


Пример Рунге 363 

— Уилкинсона 26 

Принцип А.Н.Крылова 18 

— равных влияний 16 

— неподвижной точки 244 

— Рунге 484, 551, 769 

— сжимающих отображений 244 
Пробная точка 197 

Прогонка корректная 77 

— обратная 77 

— прямая 77 

— устойчивая 77 

Прогоночные коэффициенты 77 
Проекция элемента 798 
Производная Фреше (сильная) 805 
— — — вторая 807 


Промежуток неопределенности 
корня 196 


— существования корня 197 


Простейшая квадратурная формула 
Симпсона 474 

— — — трапеций 473 

Простой снос 764 

Пространство банахово 794 

— гильбертово 637, 797 

— евклидово 796 

— линейное 793 

— метрическое 790 

— непрерывных функций 792 

— нормированное 793 

— — полное 791, 794 

— — сепарабельное 791 

— предгильбертово 796 

— самосопряженное 803 

— сопряженное 803 

— со скалярным произведением 796 

— унитарное 796 

— энергетическое 713 

Процедура исчерпывания 186 

Процесс Герона 215 

Прямой ход 56 

Псевдорешение 42 

— нормальное 43 


Равенство параллелограмма 797 


Разделенные разности 365 

Разностная схема 590, 731 

— — консервативная (дивергентная) 
744 


— — неявная 752 

— — продольно-поперечная 755 
— — явная 751 

Разностное отношение 220, 236 
— уравнение 75, 590 

— — однородное 595 


Реальный метод простых итераций 
130 


Регуляризатор 46 

Регуляризация 668 

Резольвента (разрешающее ядро) 679 
Решение нормальное 41 

— пробное 41 

— разностного уравнения общее 595 
— — — фундаментальное 595 

— — — частное 595 

— регуляризованное 46 

Ряд Неймана 680 


Сверхрелаксация 114 
Сглаживание 434 
Сдвиги 155, 185 


Семейство методов Рунге-Кутты 
второго порядка 548 


Сетка 346, 590, 626, 722, 728, 749, 
760 

Сжимающая функция 244 

Символ Кронекера 68 

Симметризация Гаусса 110 

Система возмущенная 26 

— ленточная 75 

— нормальная 110 

— Ритца 714 

— фундаментальных решений 596 

Скалярное произведение 796 

— — энергетическое 712 

Скорость сходимости средняя 204 

Слой 728, 749 

Собственная пара матрицы 136 

Собственное число 136 

Собственный вектор 136 

— элемент 136 
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Соотношение секущих 295, 296 

Спектр матрицы 138 

Спектральный радиус 32 

Способ линейной интерполяции 764 

— перебора 195 

Среднеквадратическая ошибка 
интегральная 413 

— — точечная 413 

Сплайн 437 

— базисный (В-сплайн) 453 

— — квадратичный 456 

— — кубический 457 

— — линейный 455 

— — нулевой степени 454 

— естественный (чертежный) 438 

— интерполяционный 437 

— квадратичный 445 

— кубический дефекта 1 

— локальный 459 

— сглаживающий 444 


— эрмитов 459 
Стабилизатор 47 


Стратегия (схема) Марковица 771 
Схема Горнера 272 

— двухслойная 732 

— Дюфорта и Франкела 739 

— единственного деления 66 

— Кранка-Николсон 739 

— — — — обобщенная 739 

— неявная 733 

— с весами 738 

— а оереженичы (с упреждением) 


438 


— Холецкого 66, 74 
— чисто неявная 738 


— — —_ пятиточечная трехслойная 
739 


— явная 732 
— —_ трехслойная 733 


Сходимость асимптотически 
линейная 202 


— глобальная 203 


— каркасов приближенных реше- 
ний 589 


— квадратичная 201 
— кубическая 201 
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Сходимость линейная 201 
— локальная 204 

— по метрике 790 

— по норме 794 

— сверхлинейная 201 

— сильная 797 

— слабая 797 


— со скоростью 
прогрессии 201 


— с р-м порядком 201 

— /-шаговая с порядком р 225 
— приближенных решений 588 
Счет на установление 143 


геометрической 


Таблица конечных разностей 349 

Телескопический сдвиг 402 

Теорема Банаха 92, 801 

— Вейерштрасса 393 

— Больцано-—Коши 193 

— Декарта 276 

— о разложении 798 

— Островского-Рейча 113 

— Пифагора 798 

— Рисса 802 

— Хана-—Банаха 802 

— Чебышева 387, 394 

— Штурма 276 

Точка бифуркации удвоения перио- 
да 270 

— расчетная 537 

— чебышевского альтернанса 395 

Точность абсолютная 20 

— относительная 20 


Трехточечное разностное уравнение 
второго порядка 75 
Триангуляция 722 


Узел 330, 728, 749, 760 

— базовый 354 

— внутренний 728, 749, 760, 764 
— граничный 728, 749, 760, 764 
— интерполяции 331 

— — чебышевский 391 

— квадратичного сплайна 445 
— квадратурной формулы 487 


Узел коллокации 632, 702 

— кратный 376 

— приграничный 764 

— расчетный 537, 729 

— сетки 590 

— сплайна 437 

— строго внутренний 764 
Узлы равноотстоящие 346 
Уравнение волновое 690 

— Гаммерштейна 686 

— Гельмгольца 690 

— диффузии одномерное 641 
— Лапласа (потенциала) 689 
— логистическое 266 

— математической физики 688 
— Некрасова 105 

— однородное 690, 692 

— операторное 638 

— переноса 691 

— Пуассона 689 

— разностное 590 
ты (числовое, конечное) 


— телеграфное 691 

— теплопроводности (Фурье) 689 
— — одномерное стационарное 641 
— Тихонова 48, 668 

— Урысона 686 

— характеристическое 136, 595 
Уравнения акустики 691 


— с частными производными (ти- 
пы) 692 


Ускоренный метод Либмана 778 
Ускоряющий множитель 778 
Условие Гёльдера 325 

— корней (условие ©) 602 

— Коши-Липшица 247 

— Куранта 743 

— Липшица 247, 317 

— мультипликативности норм 800 
— релаксации 227, 308 

— согласованности норм 799 
— — разностной схемы 735 

— Фурье 212 


Условия граничные 694 

— интерполяции 332 

— согласованности параметров 573 
— подчиненности норм 799 

— эрмитовой интерполяции 376 


Усовершенствованный метод по- 
следовательных приближений 261 


— — Эйлера-Коши 542 
Устойчивость разностной схемы 629 
— — — условная 736 


— — —_ безусловная (абсолютная) 
736 


— по Дальквисту 602 
— — —_ строгая (сильная) 602 
Устойчивый цикл 268 


Факторизация 64 
Формула Бинэ 225 
— Грегори 477 

— Грина 717 


— интерполирования на середину 
359 


— интерполяционная 335 

— квадратичной интерполяции 334 

— конечных приращений Лагранжа 
6 


— — —__—_ с остаточным членом 806 
— линейной интерполяции 334 

— Милна вторая (уточнения) 569 

— — первая (предсказания) 569 

— Ньютона-Лейбница 806 

— пересчета С.Бройдена 297 

— прямоугольников 468 

— Родрига 420 

— Симпсона 480 

— средней точки 468 

— Тейлора 807 

— трапеций 478 

— численного интегрирования 466 
ВИН (Адамса-Штёрмера) 


Формулы Крамера 54 
Функционал 802 

— сглаживающий 47 

— стабилизирующий 47, 668 
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Функционал Тихонова 47, 667 

— энергии (энергетического мето- 
да) 711, 712 

Функция базисная 632, 638, 724 

— весовая 495 

— В.Л.Рвачёва (К-функия) 719 

— интерполирующая 331 

— кусочно-квадратичная 432 

— кусочно-линейная 432 

— сеточная 331, 590, 626, 728 

— сжатия 244 

— табличная 331 

— финитная 642 


Характеристика 745 


Центр итерации 246 

Центральные — интерполяционные 
формулы 356 

— разности 356 

Цифра верная 18 

— значащая 18 


Частичная проблема собственных 
значений 136 


Частичное упорядочивание 58 
Числа Фибоначчи 224 

Число жесткости 609 

— обусловленности 29 

— — ненулевого простого корня 38 
— — Тодда (Тодта) 32 


Шаблон разностной схемы 731 
Шаг аппроксимации 588 

— расчетный 537 

— сетки 346, 728, 749, 760 
Шаговость метода 563 
Шаговый множитель 307 

Шум округлений 351 


Эквивалентные метрики 791 


Экономизация степенного разложе- 
ния 402 


— — ряда 399 
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Экстраполяционный метод 563 
— — Адамса-Башфорта 561 
Экстраполяция 334 

Элемент базисный 638 

— координатный 638 

— Куранта (треугольник) 724 
— цикла 270 


Явный — четырехшаговый 
Адамса 582 


Ядро вырожденное 660 

— интегрального уравнения 657 

— итерированное 680 

— мультипликативное 660 

— разрешающее (резольвента) 679 


метод 


АП]|-метод 118 
В-пространство 794 
В-сплайн 453 
ПМУГТ-алгоритм 155 
[ р-норма 795 

Г О-алгоритм 172 
ГО-разложение 62 
РМ-алгоритм 144 
4-сходимость 202 
ОК-алгоритм 176 
п-сходимость 202 
К-функция 719 

гесша #а151--метод 200 
КО]-алгоритм 158 
$Р-алгоритм 148 
$ОК-метод 113 
$$ОК-метод 780 
Орулид-метод 631 
ОТО-разложение 72 

А? -алгоритм Эйткена 257 
А? -преобразование 257 
42 -процесс Эйткена 256 


А? -ускорение 257 
= -анализ 735 
= -схема 735 


УКАЗАТЕЛЬ ОБОЗНАЧЕНИЙ И СОКРАЩЕНИЙ 


— положить по определению; присвоить 13 

я принять приближенно 149 

с неравенство в смысле главных (линейных) частей 24 
< символ эквивалентности матриц 81 

О(.), о(.) символы Ландау 49, 88, 593, 804 


67 символ Кронекера 68, 333 

Ях(а) машинное число с фиксированной запятой 20 
Я(а) машинное число с плавающей запятой 21 
тазйеру машинный эпсилон 21 

Аа оценка абсолютной погрешености числа а 13 
ба оценка относительной погрешености числа а 13 
Е единичная матрица 31, 61, 92, 136 

е; единичный вектор (орт) 61 

А матрица, обратнаяк А 29, 61, 67 

Ат, хГ транспонированные матрица, вектор 43, 91 
4е! А определитель матрицы А 54, 59, 67 

ЗрА след матрицы А 152 

ЯА, Я; собственное число матрицы А 32, 93, 136 
{7,х} собственная пара матрицы А 136 

РА спектральный радиус матрицы А 32 


соп4 А, у(А) число (мера) обусловленности матрицы А 29, 418 


Н,» пхи-матрица Гильберта 31, 417 
р(х) отношение Рэлея 139 
№ множество всех неотрицательных целых чисел 130, 218 
аготш / аргумент минимума Г 49 
отаа К градиент функции К 308, 805 
г производная по направлению п 695, 765 
<) матрица Якоби 286, 805 
5(х, г) шар радиуса г с центром в точке х 283 
А У; конечная разность А-го порядка 346 
(хзй ;хньь) разделенная разность А-го порядка 366 
Пи ©) многочлен вида (х-— хо (х-х1)й (х-х,) 336, 453 
[.(х) 1) интерполяционный многочлен Лагранжа 333 
2) многочлен Лагерра 422 
Н»(х) многочлен Эрмита 376, 422 
Т,„ (х) многочлен Чебышева 384 
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г. 


К() 
К, [а, 6] 


Са, в] 
[2 [а, Ь] 


Н 

Рх(х1, х2) 
(х, у) 

| 

[., :] 
|+ 

[А] 

А" 

ры 

ЦХ, У) 
уп-хбл-х 


ЭВМ 
СЛАУ 


МПИ 
ПВР 
СГ 
ААМН 
мнк 
ОДУ 
МКР 
МКЭ 
БПФ 
ПТИМ 


нормированный многочлен Чебышева Т, (5) /2”" 386 
многочлен Лежандра 420 
В-сплайн степени 1 с базовым узлом хх 453 


Ь 
1) значение интеграла | /(х)4& 466 


а 
2) тождественный оператор 800 
значения интеграла, полученные по формулам прямоуголь- 
ников, трапеций и Симпсона соответственно 468, 478, 480 
поправка Ричардсона 483, 552 
п-мерное пространство определенных на [а,Б] сеточных 
функций 412 
пространство А раз непрерывно дифференцируемых на [а, 6] 
функций 194, 336, 796 
пространство функций, измеримых на [а,6] и интегрируе- 
мых с квадратом 638, 796, 798 
гильбертово пространство 637, 797 
расстояние между х|1, х› Е Х (метрика) 588, 790 
скалярное произведение элементов хиу 796 
норма элемента, оператора, функционала 793, 799, 802 
энергетическая норма 713 
энергетическое скалярное произведение 712 
[р-норма (Гёльдера) 109, 795 
норма Фробениуса матрицы А 166, 801 


обратный к А оператор 40, 800 


сопряженный к А оператор 803 
пространство линейных операторов из Мв У 800 
условная и безусловная погрешности корня х 35, 36, 196 


электронно-вычислительная машина (компьютер) 22 


система линейных алгебраических уравнений 52, 91, 136, 
732, 768 


метод простых итераций 92, 244 

последовательная верхняя релаксация 113, 778 
метод сопряженных градиентов 119 
аппроксимационный аналог метода Ньютона 289 
метод наименьших квадратов 406 

обыкновенное дифференциальное уравнение 533 
метод конечных разностей 626, 727 

метод конечных элементов 642, 722 

быстрое преобразование Фурье 775 
попеременно-треугольный итерационный метод 786 


840 


Г. М. ГегсйБИ$Ку 
Еоип4дайоп$ о# Митечса1 Мео4$ 
Мозсо\, У. ЗНКоТа, 2009, 848 рр. 


Спарёег 1: Оп Сотршайопа! Еггогу 

Тре ргзй спарег сопяегу 155иез гесие4 10 сотршайопа! еггогу И 
аге ипауо4а Ме т апу питетса! апайуз15 ор тайетайса! то4е[5, ог ехат- 
ре, ийеп зойлиз [теаг ебгос зуяету апа поп-Йтеаг саг едиайопя. И 
етрйазтех Ше ипауо4аЫ арргохипеие пшиге о{ сотршег орегайопх \Ий 
гей питьегх ап ргоу4ех ехатр!ех оф ргоЫет5у ап4 тешйо4х йа! аге ех- 
тетей} зепзИтуе 10 еггогу т трш аа ап4 т агийтейс орегайопз. Тйе сйар- 
1ег атлеу а ПгяЁ ттодисйоп 10 шеЙ- апа И!-ро5е4 (Бу Надатага ап4 Бу ТИ- 
ропоу) ргоМетз, геешаттайо"п аеогийту апа Тийопоу’5 о-гезшат2тайоп 
тейо4. 


СвВарёег 2: бошйоп о} Шпеаг Айвеьгис бует5 (БгесЕ Мейо) 

Тру спарег сопзаегу тре апа р'едиепИу изе4 питетса тейо4б ор 
5о[те 5е15 о} [теаг авеБкас едиайоп$ мИЙ 5диаге соейслет тайлсез, ап4 
сопсиггепйу 5оез йе ргоетз о} туегиия тайтсез ап сотрийпя Аеегт!- 
пат5. Аопе ий ше же-кпоми Саиз$ тейо4, мшсй 15 дие4 йеге рот йе 
мемротЕ о{геа-мотА ссейсшайопз, Ше геаде" 15 {50 ргезетей мий ше гойа- 
поп тешйоа, шей 15 тоге чае %ИйЙ гезрест 10 арргохйтайоп еггогу т 
агийтейс орегайопу ап Ше Саиз5 тейо4. А[5о сопядеге4 15 Ше 5диаге 
гоо тешйой рюг 5ойлиа зуяету тИй зуттетса тайлсез ап Ше 5меер 
тешйо4 рог зуяетз тий плавопа тайчсеу (рог ехатрЁе, рог 5есопА-огаег 
1ргее-рот йпйе А фегепсе 5сйетез). 


СВареег 3: Иегайуе Мейо4$ Гог бойлиз [лпеаг Авергас Зуметз ап 
Тпуегипя Майтсех 

Соуеге4 йеге аге Иегайуе тешйо о} зойлие 5е15 ор Ппеаг авебгсис 
едиаПопу ап туегипя тайчсез. Зисй тешйо4у гергезет а уаЫМе аЙегпайуе 
10 атес тешйо4б5, ай [еая т сазез ор шей фтепяюпау. П аетопз!гаез йе 
[овс изе 10 сопягис! 5оте ор ше тоз! итромат пегайуе ргосе55ез 5исй а 
йе зптрЁе Пегайопу тетоа, Ше Ласой тео, Ше 5е4е тешоа, ше геаха- 
поп тейоа апа йе 5сйи= тейоа, апа апсйуле5 йе соп@опз юг Ше сопуег- 
зепсе о} Шезе тео 10 Ше согтесй зоиПопз. Тйе сйарег а[50 1е; а тер 
ттодисйоп 10 еяабИзйтет тешйоа$, аезстфезу ше азогийт ор йе соптизие 
этайет тейоа, ап4 ехр[ату Ше еззепсе оГШе [еа51-геячиа! тейо4. 


Спареег 4: Мейоф оГ5о[лтз А1вергас Е1вепущшие Ргоет5 

Срарег 4 тоисйе5з ироп ше то5 АЙйсий ргоет о} сотршайопа! [т- 
еаг авефга, 1.е. дпайта Ше авепуаиез апа евепуес1огу ора тайтх. И сопя1а- 
егу$ тоаеги арргоасйеу 10 Ше зоиПоп ог йе зрестай ргоМет рюг гесй-уаие 
тайтсе; мий тодегие @тепзюопаШу, зисй арргоасйе; Бетя Базе4 оп тес 
апЧ туегзе йегайопз (тсиате йегапоп$ мий @р1асетеп), а5 ме! а$ оп ше 
отровопа! гапзрюгтайоп ор йе тайтх 10 а фагота! ог тапешаг рюгт. Тре 
сйарег Чезстве5 йе 14еа$ оп уйшсй йезе тейосб аге Базе4, ргоу4ех аетта- 
поп ор рогтшаз рог Ше изе т сайсшайоп$, апа дезстВез зрес1йс сизогийт; 
жисй, т зресте4 зйиайопз, аПом опе 10 ое рагйа апа ри! евепуаие 
ргоЫетз. 


841 


Спареег 16: Оп Ше 155ие5 ор Сотршайопа! 51аБИЙу 

Тре эепег рнтисфре ор сопягисиие тешйо юг 5оте питентсей 
апаз15 рго ету 15 Чезстфе4, апА йе гесие4 сопсерй$ оГарргомтайоп, 51а- 
ЬИйу апа сопуегзеисе аге аейпеа. И! 15 зромп пом’ 5 ритср 15 аррПе4 10 
арргохмтайпие та! уаше рго ету юг ОРЕ5 ий дпие-@Йегепсе едиайопу. 
Тре тат ргорегйез ор 5оиПопх оГ [теаг йпйе-@Тегепсе едиайоп$ \ий соп- 
ат соефсет5 аге БтеЙу зиттантеа, апа Шезе ргорегйез аге еп изе4 10 
51и4у йе Бейазлог оГ йе зоиПопу ап еггогу о{ зоте ор ше трея Ппйе- 
Фрегепсе зсйетез. Тре аейпйоп ор яаБИйу ассогатя 10 Райчийя 15 о1уеп, 
жйсй аПом’5 еазу айеспоп ор ипяа Ме тишяер тейо4$. Изтз ехатр/ез, Ше 
сопсерЕ ор 5} та уаше рго ету 15 тгодисеа ап4 йе аейпоп ора 5} 
зует 15 а1теп. И’Ий йе пер ор йе 14еа оГШе яаБИйу дотат, А-яаБИйу ап4 
А(а)-яаБИйу ор рпие-@Тегепсе тейос$ аге аейпеа, итсй епзиге аррйсаБИ- 
Йу ог зисй тешоа$ о 5ойлие 51 ргоМет5. [т рагИсшаг, йе ру птрйсй 
тео оф Баскиага-@Тегеписе арргомтайоп аге шейИатей ах роззезятя 
5исй а ргорету. 


Срарёег 17: Мешой о{ Арргомтиие бошйоп о{ Воипаагу-Гаше 
Ргоетз Гог ОРЕ5 

Зеуега! арргоасйез 10 арргохтеше зоипоп ор ро-рот! [теаг Боипа- 
агу-ущие ргоетх рюг зесопа-огаег @Тегепиа! едиайопту аге сопядегей. 
Ея зие4 аге тейо йа аПом аррйсайоп ор Ше асситише4 агзепа! ог 
тео юг йе питетса! оипоп ортта![-уаше рго Мета. Тйеп, оп Ше Баз15 
ор йе трея арргохтайоп$ оГ йе аетлайлез т Ше поаез ора эта, йе й- 
пйе-ЧЕегеисе тешйо4 ор рпатз ше ргатезтогу ог 5оипопя 15 аеттуеа, ап Из 
питептса яарИЙу 15 яие4. Арргохтеие-апау Иса тейосб аге гергезете 
реге Бу Ше соПосайоп тейоа4 ап4 йе Сщегат тейоа. И 15 зйомт Ром Баз15 
ипспоп 5е15, уйсй аге гедште4 Бу Шезе тейосб, сап Бе сйозеп Гог агБИгагу 
Боипаагу сопАоп5. т фитйег аеуеортет ор Ше Сшщегап тейоа, Ше сот- 
ршапопа! рогтшаз юг Ше Пийе-@етет тейо4 аге 4ете зйеге В-зрИпез 
аге изей аб йе Базз рипсПопя. [ке т йе сазе о йе рпие-ЧТегепсе тейоа, 
ре аррйсапоп оГ ше ппие-@етет тейо4 атоит 10 5ойлиз Птеаг аиефгаис 
5уяетз тий плейаеопае соейсет тайлсез. 


СВарёег 18: Митетса! бошйоп о} 1теотга Едиайоп$ 

Тр: спарлег ргоу4е5 5оте вепегс 1трюгтайоп оп теэта/ едиайоп5, т 
рагйсшаг, оп Етедйот ап ГойЙегга Ппеаг едиайопт5. И еп 4ехстье5 а 
тешо4 рог зойяте зресла! 1урез ор1тезга едиайоп5 Кпомп а5 Ше дезепегие 
Кегие! тейоа. Тйе тат сих 15 оп Ше питептса зоийоп ог едиайоп; ий 
‘ре ппиИе ит тешоа Базе4 оп уапоих диаагииге Гогтиаз. Тр зирслепИу 
итуегза тешйо4 аШом’5 а гедиспоп ога ргоМет 5е! т 1егтз оипсйпоп; апа 
тевта!5 10 зоуте а [теаг авефгас зуяет зИЙ гезресй 10 Ше р’атемогК ор 
йе арргохтиеше зоийоп. бисй сзебгес зуяет йа5 а здиаге соейсет татх 
юг а Егеайот едиайоп апа а плапешаг тах рог а Гойегга едиайоп. Тйе 
срамег а[5о тс1иае; питетса! ехатр/е5. Тйе [а51 зеспоп ор йе српарег 15 
дейссиеа 10 ап Иегайуе диаагиге тейо4 оф сотрийпя Ше ргатеуогк ор йе 
гезо[ует. Ту тейоа изех @зсгейтайоп, оп а диаагойиге Ба515, ор йе же!|- 
Кпомт гейайоп;йр Бебрееп Ше гезоет апа йе Кегпе! оГ ап едиайоп о йе 
5есопа Юта, вий а 5ибзедиет аррйсапоп ор йе 5сйиЁ Иегайуе ргосез5. 
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Спарёег 5: Мейо оГ5ойлтя МотПтеаг 5сшаг Едиайоп5 

Тр15 срарег сопя4ег$ уатои$ азрес15 оГ зойлие опе-@йтепзюотай 
поттеаг едиайопз. брестсайЙу, и @5сиззех ше ргоМет ор Ше [осайтайоп ор 
го05, ше трея тейо45 юг паггомлте 4омт йе тегуа[5 сотеатитвя гоо(5, 
апа йе рго Мет о{ емяепсе оГгоо15. Рейпйопу аге в1ъеп Гог йе тат (урез 
оГсопуегеепсе о} Иегайуе зециепсез ап4 Ше гезресйуе ог4егу о} сопуегеепсе 
о} Пегайуе тешйосб$. т аа@йоп ю тейо уий [теаг сопуегвепсе, зисй а5 
ре @сйоюоту тешйо4 ап4 Ше сйог4 тейо4, тешйо5 ор шейег огаегу аге 
исйеа. Тйе 5сизяоп тату юсизез оп йе Меилоп-Карй5оп тейо4 апа ше 
5есат тешйоа, мшсй 15 сопзаеге4 йеге а; а то@йсайпоп ор Ше с1азясай №ем- 
1оп-Карйзоп тейо4 Бета зиретог 10 йе Меилоп-Карйхоп тейо4 т (егтз оГ 
сотршайопа ейслепсу. Тйе [а5{ 5есйоп ор Ше срарлег 15 4ейсе4 10 пем 
тейо: ше 50-саЙей роаг М№еилоп-Карйзоп тейо4 ап4 Ше роаг зесат 
тешйо4. Ргоу4е4 ша йе" рагатёегз аге сйозеп арргортиеу, Шезе тей- 
о ехрапа йе агеа ор аррйсаБИйу о{ ше с1азяса Меилоп-Карйзоп апа 5е- 
са тешйо4$ ап аетопягще раяег сопуегзепсе миро йе пее4 рог ааа! 
попа сасшайопу оррипспоп уаиез. 


СВарёег 6: Тйе 5сшаг Ехе4-Ротё РгоМет 

Тре рго ет оГппатя а гой ора поттеаг зсаг едиайоп, сопяаегеЧ 
т ше ргемюиз срармег, 15 гапзрюгте4 10 Ше едийщет ргоМет оГ дпате а 
‚Дхе4 рот офа потптеаг таррте т а опе-@тепзтопа! 5расе. Тйе [айег сап 
Бе зо»е4 Бу ше тре йегайопу тейоа. Тйе соп4Шопз Гог, апа Ше 1уре 07, 
15 тешйо4’5 сопуегзепсе аге чие4. Тйе сйарлег Шеп апайу2е мо мау 10 
ассёегие йе тешйо4’5 сопуегзепсе: АШеп’5 жеЙ-кпомт А2-ргосез5 ап йе 
[е55ег-кпом’и Би, аз Ше ехатр/ез ргом44 йеге аетопягие, тоге ейсет 
Мезяет тешйо4. Еог Ше 10815с едиайоп (тИй а рагатаег), Ше срарег 
апа/у2ех роб ШЫе 1урез оГ Бейауог Бу Иегайуе 5едиепсех зепегшеЯ Бу Ше 
5йтре пегайопу тейо4 мйеп опе ор Ше зийсет соп4оп5 рог сопуегеисе 
15 ую[ше4, ап э1уех ап тгодисйоп 10 Буигсайоп$ о зоипоп$ апа сусез. 
5ресйс ргорегйеу о} авебгаис едиайопз аге @зсиззе4 ап4 зоте тейо4у рог 
5оте Шет аге оиЙтеа, зисй аз Ше Вегпои! тешйоа, ше 14еа ор мшсй 15 
5йтйаг 10 ше ромег тешйоа юг 5оплиз Ше рагио авебгос евзепусие ргоБ- 
[ет ие4 т Сйарлег 4. 


СВарёег 7: Мейо& о} 5олтя М№оп-Йтеаг Ч тийапеои5 Едиайопн$ 

Срарег 7 соуегу а питьег о} тейо45 юг 5о[лие 5е15 ор аефгис ап 
тапзсепаета| едиайоп5. Атопя йет аге ше тре пегайопу тейоа, уат- 
оиз тоййсайопту ор ше Мемлоп-Карйзоп тейо4 (тестя ше п-ро[аг №м- 
'оп-Карйзоп тешйо4), ше Вгомп тейо4, апА Вгоудеп’5 зесат тейоа. И 15 
5роми йе 115 рго ет 15 гесище4 10 ше ргоет о{ тттииз а ГипсПоп ор 
5еует/ уата Ме; зийош сопятаит. Офегет тешо4$ аге сотрагей ий 
еасй ошйег изте а 5ресйс 5уяет аз ап ехатрёЕ. Тйе сйарег з1ийе5, гот а 
соттоп регзресйуе, сопуегсепсе оГ йе Базе апа зптрИйеа Мемлоп-Карйзоп 
тео ап4 ше тешйо4 омате4 "от йе Мемлоп-Карйзоп тейо4 Ву арр- 
те ше 5сри[: Иегайле тейоа4 10 арргомтее туегзтоп оГ.Ласо ап тайтсез. 


СВарёег 8: Роупопиа! Ттегроайоп 

Еи$Цу, хатоиз огтшайопу ор ше рго ет о{ арргохитайпз а ипсйоп 
ор опе хата Ме аге @зсиззе4, тсшате ройупотй арргомтайоп. №, йе 
тегроайоп ргоМет 15 югтшсае4 тоге ргес15е[у, йе Газтапаат ройупот И 
5ойлие 5 ргоМет 15 аейпе4, Из итциепе$$ 15 ргоуе4, ап4 йе гетатаег 
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1егт 15 аеттуе4. Айкен’; тегро!айоп 5сйете 15 сопядегеа, итсй гергезетя 
ап Иегайуе арргоасй 10 сасшайиз уашез ога ипсйпоп аейпе4 Бу а 41а (оп 
а ета) Белееп Ше по4еу Бу теапу о} Газгапелапт тегро/айоп. [и Ше сазе ор 
едшйяаи! по4е5, йпие @егепсеу аге тгодисеа, йе Базе ргорегйез аге 
теппопе4, ап4 йийе-4фегепсе тегроайиз роупопиа[5 аге сопягиме \ий 
5исй а гичиге йа еасй 5иб5едией! 1егт 15 [е55; яетйсат ап Ше ргеуоиз. 
Еогтш/а$ ий а ятйаг ягисиге йа! изе 5ерагиеа @Йегепсез аге 4етуе4 Гог 
поп-едшейяат по4ез. Тре спарлег епа; ий а яи4у ор Ше геуегуе тегро!а- 
поп рго ет ап4 йе тегройайоп ргоМет жий тшире подез. Тйе [айег 
гергезет 5 а сотьЬтайоп о} Гаэтапетап тегро!айоп апа [оса арргомтайоп 
ога ипспоп ий ше Таог юогтша. 


СВарёег 9: СйеБузйеу Роупонпиа5 апа Везё Опрогт Арргомтайоп$ 
@ АЙ роупотии$ о йе ргя Юта аге аейпе4 ап ей» ргорегйе5 
аге ие, 11 15 хроми ей, зйеп тегро/айпе а этой Гипспоп зиЙ а ройу- 
пота! ора дхе4 ромег, ше еггог 15 хтаПея урйеп Ше поаез сотс4е ий ше 
гоо15 ор ше СйеБузйеу роупотии5. Тйе СйеБузйеу аПегпапсе йеогет, мШсй 
5егуех а5 а Шеогейса Баз юг сопягисйие Без ипрюгт арргомтанопу, 15 
эеп тийош ргоо}. Тре тре! зЙиайоп$ узйеге 5исй ИО сап Бе 
сопягичеа аге сопяаегеа. Тйе сйпарлег а[50 @5сиззез йе 4еа ориятз ехрап- 
5оп ор ипсНопту то розег зетез 10 омат ройупопиа$ с1о5е 10 йе : ит- 
‚югт арргомтайоп роупопта[5. 


СВарёег 10: Тйе Геа$й 54иагех Мешой ап4а !е Ве Меап-5циаге 
'Арргомтайоп5 

ТГло тре ргоМет5 ай [еа4 10 Ше же-Кпомт [еа51 здиагеу тейо4 
аге сопяеге4: ше зоиПоп о} оуегайегтте4 [теаг сИзефтсис зуяетз апа Ше 
сросе о рагатеегу т етриса геайопуйру. А тоге зепега рго ет 15 
реп югтшшеа, Бетя Ше арргомтайоп о} ипсйопх ий зепегаЙтей рой 
пот! 5 Ш питтее теап-здиаге деуайоп5 т а сети тес. П 15 помп 
эзйси 50715 оГ155иех тау атзе { роупоти арргохтайоп 15 регогте4 изтя 
ог4тагу ехропепйа/ ипспопз. Ваяс трогтайоп оп с1азяса! отйогопа! ройу- 
пота 15 рголеа, апа а тре аиогийт юг сопягисиие а зуйет оф ог- 
'росопа роупотаб 15 ие4. брестс рюгтшаз аге ргомае4 рог аегплия 
Еоитег ропот! арргомтайпе а етеп рипсйоп т ап теста ог рот 
5епзе. 


Спарег 11: /ийегроайоп 5$рИте$ 

Тиз сйарег сопяаег$ а иеу ейсет тешо4 о{ арргомтайие а 1а- 
Ые-4ейпе4 рипсйоп жий а сотрозйе }ипсйоп зйозе сотропепй5 аге [ом 
ромшег ро’попиа!5 аПомлтя тоой соппесйоп. Атопе жИй пиига сие 
5рИтез, ушей йауе сигеа4у Бесоте с1азясай, рагаБойс (диаагайс) тегройа- 
поп 5рИтез аге або чийеа йеге, а тей аз Баз 5рИтез (В-5рйте5) апа Нег- 
тат (оса!) зрИтеу о} о4Я ап4 еуеп ромегз. Тйе сйарег э1»еб ап тгодис- 
поп 10 йе зтоойте офетриса аа жий ятр [теаг Пег$ апа рот$ ош 
1ре розяфИйу оГсопягисйия зтоотя 5р/тез. 


Спареег 12: Митетса! 1теэгайоп 

Мефо рог арргохмтеие сасшайоп о{ аейпйе тезга5 аге аеп»еЧ 
ра аге Базе оп 5итття Ше уаиез оГ йе тезгапа жий Чегет соей- 
слетя. Тре тейо4$ сопя4еге4 аге йе диааиииге рюгтиа$ о{ гечапе[ез, га- 
реитз, 5трзоп, СйеБузйеу, апа Саизу. 5реси айеппоп 15 ра о Бит 
е[пслет! аеогийт5у Ша аПом сотрийия ше тезта уаше узий рге-зресте4 
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ассигасу ап4 йе питтит атоит о} сотршайоп5. Тйеу аге Базе оп йе 
Кипее тейо4 о} ргасйса! аззеуутет офассигасу о{ гези!5 Бу 4ои _е сотри- 
тапоп ий Афегет тезй 512е5, ап тр геайопзй1 ру Бебтееп зоте диаага- 
шге рогтиа$. Тйе ргоМет о} сотрийпе йитргорег 1теэга[5 15 або оисйеЯ 
ироп. 


СвВарёег 13: Арргомтайоп ор еттлайуех 

Ву Йегепйайоп о} 1тегроайоп рюгтша$, огтша5 рог арргохитеие 
сасшайоп о} аетлайуез аге аеттуеа. Тйе гетатаег (егтз ор йе аетте4 ар- 
ргомтае рогттша5 аге оматеа Бу изтя ше Тадог югтша апа @регепйач- 
те Ше гезресйле гетатаег (егту ое тегроапоп рюгти[аз. А 5ресла/ ое 
15 аттеп 10 ше ятр/ез! Йг51- апа зесопа-огаег арргохтайоп$ оГ йе йгя ап 
5есопА ает»айлех т Ше поаез о{ йе эта. Тйезе арргохтайопз аге емеп- 
5е[» изей т зиБ5едиет срарегз. Ацеппоп 15 а[50 амп 10 йе емяепсе ог 
5исй эта Яер5 ийеге ше Птие4 ргесляоп орсасшайие йе уаше5х ор йе Гипс- 
поп йаз ше таЙея ейес! оп Ше ассигасу ор Ше сасшае4 арргохтеие уа!- 
ие оГ йе аеттайуея. 


Спарёег 14: Тиле Ешег ап4 Кипзе-Кийа Мейо4$ ор 5облтя та 
Гцие РгоЫет5 ог ОРЕ5 

Тре ргоМет ор йпате арргохипеие зошПоп5 ор йг1-огаег ог@тагу 
Легепйа едиайоп$ ий эатеп та сопаопз 15 огтишшеа. Сопяегайоп 15 
этлеп 10 уатоиз уауу ор аетуте ше Ешег тейо4, утсй гергезетз йе ят- 
р/ея зрес! сазе о} зеуега! этоиру о{ питетса! ргосеззех Базе оп Чегет 
4еаз. 1ттейще то@йсайопх ор йе Ешег тейо4 аге сопз4еге4. Опе ор 
5исй то тйсайоп5, йе соггечей Ещшег тейоа, [еа4б$ 10 Ше ратйу о} 5есопа- 
огаег Кипзе-—Кийа тешйоа$5. Тйе зепега! югт оф Кипзе-—Кийа югтиша$ оГап 
агфигагу огаег 15 эпШеп ош, ап а веотейчс тегргаайот ор йе с1азяса! 
юитй-огаег Кипзе-Кийа тейо4 15 э1еп. Тйе 155иез ор сотгоШтз ассигасу 
оп еасй Чер тйеп аррлие Ше тешйо45 аге @зсиззе4 апа йе Кийа-—Мегзоп 
аеогийт 15 ргомаеа. Тиз аеогийт 50уе; йе ргоМет о{ ашотсееа сйосе 
ор {йе чер 512е юг ше питетса! тезэтайоп ор ап та уаше рго Мет ий 
эттеп ассигасу. 


СВарёег 15: /[4иеаг Мшияер Мейо4$ 

Оп йе Бая15 ортезгайоп ап тегро!айоп, 5еуега! ат Иез оГ пите!1- 
сё тешйосб рог золия Ше Саисйу рго Мет юг ОБЕ$ аге 4етуе. бисй тей- 
о, сотраге4 ий тийяаее утёе-яер тейо4у ор Ше 5ате ог4егу ор асси- 
гасу, рауе ше адзатаве о} эгешег сотршайопа! ейсепсу Бесаизе Шеу изе 
трогтайоп оп ше зоипоп т 5еуега! ргесеате ротй5. П 15 зйоут Йом сот- 
Бте4 аррйсайоп оГехрИси ап4 птрйси огтша5 ор е 5ате огаег о} асси- 
гасу сап Бе изе4 рог тре арргохипеие сотго! о} сотршайоп еггог оп еасй 
$(ер. Аопе ИЙ 5ресйс атШеу ор тишяер тейоа$, юг ехатр!е, ше А4ат5 
апа МИп тейо4$, Ше эепегай хгис1иге ор тиияер тейосб 15 сопяаегеа. И 
15 аетопяиие4 йа! и 15 роз е 10 йх йе рагатаегу ор зисй тешйо4 Базе4 
оп йе сопсерй ога тешйо4’; аефгойс ассигасу огаег. 11 15 пое4 йа! а йе 
тешйо сопяаеге4 аге аррйсаЫе 10 5ойлиз 5е15 ор афегепиа едиайоп$ апЯ 
едиайот$ ор Шейег огаегу. Тйе 4етлайоп ор йе Адатз ап4 Адатя—бюогтег 
тешосб рюг 5есопа-огаег едиапопу 15 аезстьеа. 
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Спарёег 19: Рагйа! ОИфегепиа! Едиайоп$ 

Вазс едиайоп$ ор тайетайса! рйу51с5 апа йе гезресйле ргоМетз аге 
игшеп ош апа с1азятеа. Тре геадегу аге геттаеа оропе ое }е апщуйса! 
тешйо4$ о{5о[лтз едиайопз оГтайетайса! рйу5гсз, йе Еоитег тейоа. 15 
тео“ 15 аррПеа йеге 10 золте ше БилсШе ргоМет юг Ше Гар/асе едиа- 
поп т а гечап8. Тло арргоасйех 10 сопягисиия ше 5ептт-@зстае та 
Ппе; тейо4 аге 4езствеа, опе Бете Базе4 оп ргодесйоп$ апа йе ошег оп Й- 
пие Аегепсез. Тр тейоа 15 аетопягие4 изте Ше ехатрЁе о ап та 
Боипаагу уаше ргоМет Гог Ше йеа! гапз}ег едиапоп. А уатайопа! зейиз Гог 
ап орегог едиайоп т а НИБей 5расе 15 еп сопяаегеа, зисй зете ([еате 
10 Ше епегоу тешйоа. Тйе Ки: тейоч 15 сопячеге4 аз а гезий оГ ритйег ае- 
уе[ортет оГ йе [айег. П 15 зромп зйсй Ше аррйсайоп ор йе Ки: тейоа 15 
гедисе4 10 т ше сазе ор золтя йе БилеШе рго ет рог Ше Ро155оп едиайоп. 
А[50 [514 аге йе тоз! итромат рот! йа! геЙес! йе е5зепсе о} ше йийе- 
ейетет тейо4 Базе оп Ше Ки: тейо4 уйеге 1то-Чйтепзтопа! В-5рИтез аге 
срозеп ау ше соог4теие ипсйопия. 


Спариег 20: Етйе Оуегепсе Мешо4$ рог 5отэ Езошйоп РгоШет$ 

Кеуегтз о йе дийе @Тегепсе тейоа, 5исй а5 а ета, вт те, ттег- 
па! апа Боипаагу по4ез, а [ауег, ап Ше 1етр/ ще оГ а @Йегепсе зсйете 
атопз$ ошегу, аге изеа 10 АезстБе Ше ргосе55ех рог сопягисиие ехрПсй апа 
ипрйси лийе @Тегеписе 5сйетез юг поп-яайопагу ргоету оп Ше Ьа515 ор 
йе ятрея Ппйе а тфегеписе арргохтайопу о} 4етлайуех ие т Срарег 
13. 7/5 15 4опе оп йе ехатр/ез ор йе опе-@тепзюпа! ап мо-@тепяюопай 
рес! гапз}ег едиайоп$ ап Ше уауе едиайоп. Тйе гапзрот едиайоп 15 45- 
сиззе4 10 йе емет песеззагу 10 Па® йе рго Мет оГ йе етегзеисе о} @5соп- 
ппиои5 зоиПоп5 апА 5йом’ Ше пее4 юг соп5егуайхе зсйетез. Эреста/ айепйоп 
15 ра 10 сопягисйие есопотиса 5сйетез, т рагИсшаг, ше тейо4 ор айег- 
пайие @тесйопу. СопашШопа! ог абзоше заБИйу оГ ше рпие @Йегепсе 
5сйетез сопз4егеа 15 5сие4 (ий гёеуаий зоигсе геёегепсез ргоу4еа) Би пой 
ргоуе4. 


СвВарёег 21: Ешйе Регепсе Мейо4$ рог 5 айопагу РгоЫет5 

[и ше дотат ога о-@тепяопа! ерис едиайоп, а ипфогт гесапзи- 
[аг эт 4 15 итгодисеЧ ап зесопа-огаег йпие @Шегепсе зсйетез аге соп- 
гисе4 оп а сго55-ШШе 1етр/еие. И 15 5йоми вом Боипаагу сопАоп$ оГ ше 
„Дея «та сап Бе 1акеп {то ассоит т сазе оГап агЬигагу дотат апа йом’ йе 
погт@ аептлайуех сап Бе арргохипшеа рог Боипаагу сопоп5 ор Ше 5есоп4 
апа ига Юта. 1 15 етрйазте4 1йс ше тайтсез оГ йе омате4 5е15 ор @ег- 
епсе едиайоту аге зрагзе ап4, т рагисшаг, сей Шеу роз5ез5 а Ыоск- 
итазопа! ягисиге йе рго Мет 15 зе! т а гечап8е. Тйе ресийатшез апЯ 
ре арргортеиепе55 ор йе аррйсайоп ор тес! апа йегайуе тейо4 оГ5оте 
Ппеаг зуяетз (Сйарлегу 2 апа 3) 10 5исй 5реси зуяетз аге @5сиззеа. П 15 
роте4 ош 1рай Шеге аге тешйоа$ йа! аге есопописа/ апа уе 5ийе4 рог 115 
ригрозе. Неййешей атопе Шет 15 Ше Иегайуе тешйо4 о} айегпайия @гтес- 
Поп, ийсй 15 ап трететайпоп о} ше еяабЙйтет ритсрЕ. А питетсай 
ехатрЁ 15 сопзщегей зий йе изе ор йе бе апа 5ОК тейосб. 


Аррепах 1. 5$оте }асв гот Гипсйопа! апа[у515 


Аррепахх 2. 5$атре ргасйси ехегсё5е5 
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ОБ АВТОРЕ 


Валентин Михайлович Вержбицкий 
(1942—2014) — кандидат физико-матема- 
тических наук, профессор, видный ученый 
в области функционального анализа и 
вычислительной математики. Автор более 
60 научных публикаций и учебных 
пособий с грифом Министерства образо- 
вания РФ. Заслуженный — работник 
народного образования Удмуртской 
республики, почетный работник высшего 
образования РФ. 

Валентин Михайлович родился в Краснодарском крае в династии 
учителей, но после окончания Краснодарского государственного 
педагогического института уехал на север. Работал преподавателем 
математики, физики и химии в школе поселка Ессей в Эвенкии (сегодня — 
Эвенкийский район Красноярского края). Позднее вернулся в родной 
институт и стал работать сначала лаборантом, затем ассистентом кафедры 
математического анализа. После окончания аспирантуры в Кубанском 
государственном университете и защиты диссертации на степень кандидата 
физико-математических наук, переехал в г. Ижевск Удмуртской АССР и стал 
преподавать на кафедре высшей математики Ижевского механического 
института. 

В 2005 году Валентину Михайловичу было присвоено звание 
профессора. 

В 2006 году присуждена Государственная премия Удмуртской 
Республики в области литературы, искусства и образования за серию 
учебников по численным методам для математических и инженерных 
специальностей. 

Помимо преподавательской деятельности, вел активную научную 
работу, публиковался в журналах «Математика» и «Журнал вычислительной 
математики и математической физики». Увлекался горным туризмом, 
фотографией и киносъемкой. 

Учебники, созданные Валентином Михайловичем Вержбицким, 
являются основными пособиями для студентов многих российских вузов. 
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